JP2018515089A - Penicillin G acylase - Google Patents

Penicillin G acylase Download PDF

Info

Publication number
JP2018515089A
JP2018515089A JP2017557457A JP2017557457A JP2018515089A JP 2018515089 A JP2018515089 A JP 2018515089A JP 2017557457 A JP2017557457 A JP 2017557457A JP 2017557457 A JP2017557457 A JP 2017557457A JP 2018515089 A JP2018515089 A JP 2018515089A
Authority
JP
Japan
Prior art keywords
pga
sequence
polypeptide
amino acid
acylase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017557457A
Other languages
Japanese (ja)
Other versions
JP6755886B2 (en
JP2018515089A5 (en
Inventor
ゴウタミ バナージー,
ゴウタミ バナージー,
ジエ ヤン,
ジエ ヤン,
シユン ザン,
シユン ザン,
エリカ エム. ミルチェク,
エリカ エム. ミルチェク,
メリッサ アン メイヨー,
メリッサ アン メイヨー,
スティーブン ジェンヌ,
スティーブン ジェンヌ,
Original Assignee
コデクシス, インコーポレイテッド
コデクシス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コデクシス, インコーポレイテッド, コデクシス, インコーポレイテッド filed Critical コデクシス, インコーポレイテッド
Publication of JP2018515089A publication Critical patent/JP2018515089A/en
Publication of JP2018515089A5 publication Critical patent/JP2018515089A5/ja
Application granted granted Critical
Publication of JP6755886B2 publication Critical patent/JP6755886B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • C12N9/84Penicillin amidase (3.5.1.11)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/48Drugs for disorders of the endocrine system of the pancreatic hormones
    • A61P5/50Drugs for disorders of the endocrine system of the pancreatic hormones for increasing or potentiating the activity of insulin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/01011Penicillin amidase (3.5.1.11), i.e. penicillin-amidohydrolase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Diabetes (AREA)
  • Biomedical Technology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Endocrinology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Emergency Medicine (AREA)
  • Obesity (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本発明は、改善された特性を有する操作されたペニシリンGアシラーゼ(PGA)酵素、このような酵素をコードするポリヌクレオチド、酵素を含む組成物、および酵素の使用方法に関する。本発明は、インスリンからA1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを生成することができる操作されたペニシリンGアシラーゼであって、配列番号2、4、6、8、10、および/または12と少なくとも約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、またはそれを超えて同一であるペニシリンGアシラーゼを提供する。The present invention relates to engineered penicillin G acylase (PGA) enzymes with improved properties, polynucleotides encoding such enzymes, compositions comprising the enzymes, and methods of using the enzymes. The present invention is an engineered penicillin G acylase capable of removing the A1 / B1 / B29 triphenylacetic acid protecting group from insulin to produce free insulin, comprising SEQ ID NOs: 2, 4, 6, 8, 10 And / or 12 and at least about 85%, about 86%, about 87%, about 88%, about 89%, about 90%, about 91%, about 92%, about 93%, about 94%, about 95% A penicillin G acylase that is about 96%, about 97%, about 98%, about 99%, or more identical.

Description

本願は、2015年5月7日に出願された米国仮特許出願第62/158,118号(これは、全ての目的のためにその全体が参考として本明細書に援用される)への優先権を主張する。   This application is a priority over US Provisional Patent Application No. 62 / 158,118, filed May 7, 2015, which is hereby incorporated by reference in its entirety for all purposes. Insist on the right.

配列表、表またはコンピュータプログラムへの参照
米国特許法施行規則§1.821の下、EFS−Webを介してコンピュータ可読形態(CRF)で、ファイル名CX2−149WO1_ST25.txtとして本願と同時に提出された配列表は、参考として本明細書に援用される。配列表の電子コピーは、2016年4月28日に作成され、ファイルサイズは88キロバイトである。
Reference to Sequence Listing, Table or Computer Program File name CX2-149WO1_ST25.E in computer readable form (CRF) via EFS-Web under US Patent Law Enforcement Regulations §1.821. The sequence listing submitted at the same time as this application as txt is incorporated herein by reference. An electronic copy of the sequence listing was created on April 28, 2016, and the file size is 88 kilobytes.

本発明は、操作されたペニシリンGアシラーゼ(PGA)酵素、酵素をコードするポリヌクレオチド、酵素を含む組成物、および操作されたPGA酵素の使用方法を提供する。   The present invention provides engineered penicillin G acylase (PGA) enzymes, polynucleotides encoding the enzymes, compositions comprising the enzymes, and methods of using the engineered PGA enzymes.

ペニシリンGアシラーゼ(PGA)(ペニシリンアミダーゼ、EC3.5.1.11)は、ペニシリンG(ベンジルペニシリン)側鎖のアミド結合の切断を触媒する。この酵素は、6−アミノ−ペニシラン酸(6−APA)およびフェニル−酢酸(PAA)の製造において商業的に使用される。6−APAは、アモキシシリン、アンピシリンおよびセファレキシンなどの半合成βラクタム系抗生物質の工業生産において重要な化合物である。天然に存在するPGA酵素は、商業的なプロセスにおいて不安定性を示し、それにより、商業的に適用するためには固体基材(solid substrate)への固定化が必要になる。PGAは様々な支持体に共有結合されており、PGA固定化系が純粋な光学異性体を合成するための有用なツールとして報告されている。しかし、固体表面への結合により、活性および/または選択性の低下など、酵素特性が損なわれ、溶質への接近が限定される。さらに、固体基材への結合により、酵素を捕捉し、さらなるプロセシングサイクルにおいて再利用することが可能になるが、酵素の安定性は、このような適用を限定し得るようなものである。ペニシリンGから6−APAへのPGAによる酵素的触媒作用は、位置特異的(ラクタムアミド結合は切断しない)かつ立体特異的なものである。6−APAの生成は、おそらく医薬品の生成における酵素的触媒作用の最も大きな利用を構成する。PGAの酵素活性は、フェナセチル部分に関連し、第一級アミンならびにアルコールの多種多様なフェナセチル誘導体の立体特異的加水分解を可能にするものである。   Penicillin G acylase (PGA) (penicillin amidase, EC 3.5.1.11) catalyzes the cleavage of the amide bond on the penicillin G (benzylpenicillin) side chain. This enzyme is used commercially in the production of 6-amino-penicillanic acid (6-APA) and phenyl-acetic acid (PAA). 6-APA is an important compound in the industrial production of semisynthetic β-lactam antibiotics such as amoxicillin, ampicillin and cephalexin. Naturally occurring PGA enzymes exhibit instability in commercial processes, which necessitates immobilization on a solid substrate for commercial application. PGA is covalently bound to various supports, and PGA immobilization systems have been reported as useful tools for synthesizing pure optical isomers. However, binding to a solid surface impairs enzyme properties, such as reduced activity and / or selectivity, and limits access to solutes. Furthermore, binding to a solid substrate allows the enzyme to be captured and reused in further processing cycles, but the stability of the enzyme is such that such applications can be limited. The enzymatic catalysis by PGA from penicillin G to 6-APA is regiospecific (does not cleave the lactamamide bond) and stereospecific. The production of 6-APA probably constitutes the greatest use of enzymatic catalysis in the production of pharmaceuticals. The enzymatic activity of PGA is related to the phenacetyl moiety and allows for stereospecific hydrolysis of a wide variety of phenacetyl derivatives of primary amines as well as alcohols.

本発明は、操作されたペニシリンGアシラーゼ(PGA)酵素、酵素をコードするポリヌクレオチド、酵素を含む組成物、および操作されたPGA酵素の使用方法を提供する。   The present invention provides engineered penicillin G acylase (PGA) enzymes, polynucleotides encoding the enzymes, compositions comprising the enzymes, and methods of using the engineered PGA enzymes.

本発明は、インスリンからA1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを生成することができる操作されたペニシリンGアシラーゼであって、配列番号2、4、6、8、10、および/または12と少なくとも約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、またはそれを超えて同一であるペニシリンGアシラーゼを提供する。いくつかの実施形態では、本発明は、インスリンからA1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを生成することができる操作されたペニシリンGアシラーゼであって、配列番号2、4、6、8、10、および/または12と少なくとも85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超えて同一であるペニシリンGアシラーゼを提供する。いくつかのさらなる実施形態では、本発明は、インスリンからA1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを生成することができる操作されたペニシリンGアシラーゼであって、配列番号2、4、6、8、10、および/または12を含むペニシリンGアシラーゼを提供する。いくつかのさらなる実施形態では、ペニシリンGアシラーゼは、表5.1、表6.2、および/または表6.3において提供される変異を少なくとも1つ含む。   The present invention is an engineered penicillin G acylase capable of removing the A1 / B1 / B29 triphenylacetic acid protecting group from insulin to produce free insulin, comprising SEQ ID NOs: 2, 4, 6, 8, 10 And / or 12 and at least about 85%, about 86%, about 87%, about 88%, about 89%, about 90%, about 91%, about 92%, about 93%, about 94%, about 95% A penicillin G acylase that is about 96%, about 97%, about 98%, about 99%, or more identical. In some embodiments, the invention is an engineered penicillin G acylase that can remove A1 / B1 / B29 triphenylacetic acid protecting groups from insulin to produce free insulin, comprising SEQ ID NO: 2, 4, 6, 8, 10, and / or 12 and at least 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, Penicillin G acylases that are 97%, 98%, 99%, or more identical are provided. In some further embodiments, the invention is an engineered penicillin G acylase capable of removing the A1 / B1 / B29 triphenylacetic acid protecting group from insulin to produce free insulin, comprising SEQ ID NO: 2 Penicillin G acylases comprising 4, 6, 8, 10, and / or 12 are provided. In some further embodiments, the penicillin G acylase comprises at least one mutation provided in Table 5.1, Table 6.2, and / or Table 6.3.

本発明は、配列番号3、5、7、9、および11から選択される配列に対して少なくとも約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、またはそれを超える配列同一性を有するポリヌクレオチド配列によってコードされるペニシリンGアシラーゼも提供する。   The present invention provides at least about 85%, about 86%, about 87%, about 88%, about 89%, about 90%, about 90% to a sequence selected from SEQ ID NOs: 3, 5, 7, 9, and 11. Encoded by a polynucleotide sequence having sequence identity of 91%, about 92%, about 93%, about 94%, about 95%, about 96%, about 97%, about 98%, about 99%, or more Penicillin G acylase is also provided.

いくつかの実施形態では、ポリヌクレオチド配列によってコードされるペニシリンGアシラーゼは、配列番号3、5、7、9、および11から選択される配列に対して少なくとも85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有する。いくつかの実施形態では、ペニシリンGアシラーゼは、配列番号3、5、7、9、および11から選択されるポリヌクレオチド配列によってコードされる。本発明は、本明細書に提示されるポリヌクレオチド配列(例えば、配列番号3、5、7、9、および/または11)を含むベクターも提供する。本発明は、本明細書に提示されるベクター(例えば、配列番号3、5、7、9、および/または11のポリヌクレオチド配列を含むベクター)を含む宿主細胞も提供する。   In some embodiments, the penicillin G acylase encoded by the polynucleotide sequence is at least 85%, 86%, 87%, 88 relative to a sequence selected from SEQ ID NOs: 3, 5, 7, 9, and 11. %, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more sequence identity. In some embodiments, the penicillin G acylase is encoded by a polynucleotide sequence selected from SEQ ID NOs: 3, 5, 7, 9, and 11. The present invention also provides vectors comprising the polynucleotide sequences presented herein (eg, SEQ ID NOs: 3, 5, 7, 9, and / or 11). The present invention also provides host cells comprising the vectors presented herein (eg, vectors comprising the polynucleotide sequences of SEQ ID NOs: 3, 5, 7, 9, and / or 11).

本発明は、遊離のインスリンを生成するための方法であって、i)本明細書に提示される少なくとも1つの操作されたペニシリンGアシラーゼ、およびA1/B1/B29トリフェニル酢酸保護基を含むインスリンを提供すること;ならびにii)操作されたペニシリンGアシラーゼによりA1/B1/B29トリフェニル酢酸保護基が除去され、遊離のインスリンが生成する条件下で、操作されたペニシリンGアシラーゼを、A1/B1/B29トリフェニル酢酸保護基を含むインスリンに曝露することを含む方法も提供する。方法のいくつかの実施形態では、ペニシリンGアシラーゼは、配列番号2、4、6、8、10、および/または12と少なくとも約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、またはそれを超えて同一である。方法のいくつかの実施形態では、ペニシリンGアシラーゼは、配列番号2、4、6、8、10、および/または12と少なくとも85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超えて同一である。方法のいくつかのさらなる実施形態では、ペニシリンGアシラーゼは、配列番号2、4、6、8、10、および/または12を含む。いくつかの実施形態では、操作されたペニシリンGアシラーゼは、90%超、91%超、92%超、93%超、94%超、95%超、96%超、97%超、98%超、99%超またはそれを超える遊離のインスリンを生成する。本発明は、本明細書に提示される方法(複数可)に従って生成した遊離のインスリンを含む組成物も提供する。   The present invention is a method for producing free insulin comprising i) at least one engineered penicillin G acylase as presented herein and an A1 / B1 / B29 triphenylacetic acid protecting group And ii) the engineered penicillin G acylase is subjected to removal of the A1 / B1 / B29 triphenylacetic acid protecting group and free insulin is produced under conditions where the engineered penicillin G acylase is A1 / B1. Also provided is a method comprising exposing to an insulin comprising a / B29 triphenylacetic acid protecting group. In some embodiments of the method, the penicillin G acylase is at least about 85%, about 86%, about 87%, about 88%, about 89 with SEQ ID NOs: 2, 4, 6, 8, 10, and / or 12. %, About 90%, about 91%, about 92%, about 93%, about 94%, about 95%, about 96%, about 97%, about 98%, about 99%, or more than the same . In some embodiments of the method, the penicillin G acylase is at least 85%, 86%, 87%, 88%, 89%, 90%, SEQ ID NO: 2, 4, 6, 8, 10, and / or 12. 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more identical. In some further embodiments of the method, the penicillin G acylase comprises SEQ ID NOs: 2, 4, 6, 8, 10, and / or 12. In some embodiments, the engineered penicillin G acylase is greater than 90%, greater than 91%, greater than 92%, greater than 93%, greater than 94%, greater than 95%, greater than 96%, greater than 97%, greater than 98% Produces more than 99% or more free insulin. The present invention also provides compositions comprising free insulin produced according to the method (s) presented herein.

図1は、改変体1を用いて観察された基質阻害活性を示すグラフを提供する。FIG. 1 provides a graph showing the substrate inhibitory activity observed with variant 1.

図2は、7種の改変体PGAを使用して生成した遊離のインスリンの量を示すグラフを提供する。FIG. 2 provides a graph showing the amount of free insulin produced using the seven variants PGA.

図3は、3種の改変体PGAを使用して生成した遊離のインスリンの%収率を示すグラフを提供する。FIG. 3 provides a graph showing the percent yield of free insulin produced using the three variants PGA.

図4は、反応物中にDMSOの存在下、3種の改変体PGAを使用して生成した遊離のインスリンの%収率を示すグラフを提供する。FIG. 4 provides a graph showing the percent yield of free insulin produced using the three variants PGA in the presence of DMSO in the reaction.

本発明は、ペニシリンを、フェニル酢酸と、多種多様なβラクタム系抗生物質の合成における重要な中間体である6−アミノペニシラン酸(6−APA)とに切断することができる操作されたペニシリンGアシラーゼ(PGA)を提供する。特に、本発明は、A1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを放出させることができる操作されたPGAを提供する。   The present invention relates to an engineered penicillin capable of cleaving penicillin into phenylacetic acid and 6-aminopenicillanic acid (6-APA), an important intermediate in the synthesis of a wide variety of β-lactam antibiotics. G acylase (PGA) is provided. In particular, the present invention provides engineered PGAs that can remove A1 / B1 / B29 triphenylacetic acid protecting groups to release free insulin.

一般に、天然に存在するPGAは、α−サブユニットとβ−サブユニットとで構成されるヘテロ二量体酵素である。野生型PGAは、ペリプラズムへのトランスロケーションを媒介するN末端シグナルペプチドおよびαサブユニットのC末端とβサブユニットのN末端を接続するリンカー領域を含有するプレ−プロ−PGAポリペプチドとして天然に合成される。タンパク質プロセシングにより、成熟ヘテロ二量体酵素が生じる。分子間リンカー領域はまた、酵素の適切なフォールディングの促進においても機能する。本明細書に記載されるPGAは、下に詳細に記載されるように改善された酵素特性が生じるように様々な改変が導入されている、Kluyvera citrophilaに由来するPGAに基づく。   In general, naturally occurring PGA is a heterodimeric enzyme composed of an α-subunit and a β-subunit. Wild-type PGA is naturally synthesized as a pre-pro-PGA polypeptide containing an N-terminal signal peptide that mediates translocation to the periplasm and a linker region that connects the C-terminus of the α subunit and the N-terminus of the β subunit. Is done. Protein processing results in the mature heterodimeric enzyme. The intermolecular linker region also functions in promoting proper folding of the enzyme. The PGAs described herein are based on PGAs derived from Kluyvera citrophila in which various modifications have been introduced to produce improved enzyme properties as described in detail below.

本明細書に提示される説明に関して、単数の使用は、他に特に指定がなければ、複数を包含する(逆もまた同じである)。例えば、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈によりそうでないことが明白に示されない限り、複数の指示対象を包含する。同様に、用語「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含む(include)」、「含む(includes)」、および「含む(including)」は、互換的であり、限定するものではない。様々な実施形態の説明で用語「含む(comprising)」が使用される場合、いくつかの特定の例では、実施形態は、代わりに「から本質的になる」または「からなる」という言葉を使用して記載することができることが当業者には理解されることがさらに理解されるべきである。   In the context of the description presented herein, the use of the singular includes the plural (and vice versa) unless specifically stated otherwise. For example, the singular forms “a”, “an”, and “the” include plural referents unless the context clearly indicates otherwise. Similarly, the terms “comprise”, “comprises”, “comprising”, “include”, “includes”, and “including” are interchangeable. And not limiting. Where the term “comprising” is used in the description of the various embodiments, in some specific examples, embodiments use the terms “consisting essentially of” or “consisting of” instead. It should be further understood that one skilled in the art would understand that

図を含む前述の一般的な説明および以下の詳細な説明はどちらも、単に例示および説明のためのものであり、本開示を限定するものではない。さらに、本明細書で使用される節の表題は、単に組織化を目的とするものであり、記載されている主題を限定するものとは解釈されない。   Both the foregoing general description, including the figures, and the following detailed description are for purposes of illustration and description only and are not intended to limit the present disclosure. Further, the section headings used herein are for organizational purposes only and are not to be construed as limiting the subject matter described.

定義
本明細書で使用される場合、以下の用語は、以下の意味を有するものとする。
Definitions As used herein, the following terms shall have the following meanings:

本開示に関して、本明細書における説明で使用される科学技術用語は、明確な定義がない限り当業者に一般に理解されている意味を有する。したがって、以下の用語は、以下の意味を有するものとする。本明細書で言及される特許および刊行物は、このような特許および刊行物に開示されているすべての配列を含めて、すべてが、明白に参照により組み込まれる。別段の特定のない限り、本発明の実施には、当業者に公知の、分子生物学、発酵、微生物学、および関連する分野において一般に使用される従来の技術が伴う。別段の定義のない限り、本明細書では、本明細書において使用されるすべての科学技術用語は、本発明が属する技術分野の当業者に一般に理解されているものと同じ意味を有する。本明細書に記載される方法および材料と類似した、またはそれと等しい任意の方法および材料を本発明の実施または試験において使用することができるが、好ましい方法および材料が記載されている。実際に、本明細書に記載されている特定の方法体系、プロトコール、および試薬は使用される状況に応じて変動し得るので、本発明はこれらに限定されないものとする。本明細書に提示される表題は、本発明の様々な態様または実施形態を限定するものではない。   For purposes of this disclosure, scientific and technical terms used in the description herein have the meaning commonly understood by one of ordinary skill in the art unless otherwise defined. Accordingly, the following terms shall have the following meanings: All patents and publications referred to herein are expressly incorporated by reference, including all sequences disclosed in such patents and publications. Unless otherwise specified, the practice of the present invention involves conventional techniques commonly used in molecular biology, fermentation, microbiology, and related fields, as known to those skilled in the art. Unless defined otherwise herein, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although any methods and materials similar or equivalent to those described herein can be used in the practice or testing of the present invention, the preferred methods and materials are described. Indeed, the particular methodology, protocols, and reagents described herein may vary depending on the context in which they are used, and the invention is not intended to be limited thereto. The titles presented herein are not intended to limit various aspects or embodiments of the invention.

それにもかかわらず、本発明の理解を容易にするために、いくつもの用語を以下に定義する。数値範囲は、その範囲を規定する数値を含む。したがって、本明細書に開示されているあらゆる数値範囲は、このような広範な数値範囲内に入るあらゆる狭い数値範囲を、このような狭い数値範囲が本明細書においてすべて明確に記載されているものと同じく包含することが意図されている。本明細書に開示されているあらゆる最大(または最小)の数値限定は、あらゆるより低い(またはより高い)数値限定を、このようなより低い(またはより高い)数値限定が本明細書において明確に記載されているものと同じく包含することも意図されている。   Nevertheless, in order to facilitate understanding of the present invention, a number of terms are defined below. Numerical ranges include numerical values that define the range. Accordingly, any numerical range disclosed herein is intended to encompass any narrow numerical range falling within such broad numerical range, where such narrow numerical range is all expressly recited herein. It is intended to be included as well. Any maximum (or minimum) numerical limit disclosed herein shall be construed herein as any lower (or higher) numerical limit, and such lower (or higher) numerical limits are explicitly defined herein. It is intended to encompass the same as described.

本明細書で使用される場合、用語「含む(comprising)」およびその同語族は、それらの包括的な意味で使用される(すなわち、用語「含む(including)」およびその対応する同語族と同等である)。   As used herein, the term “comprising” and its congeners are used in their generic sense (ie, equivalent to the term “including” and its corresponding congeners). Is).

本明細書および添付の特許請求の範囲において使用される場合、単数「1つの(a)」、「1つの(an)」および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数への言及を包含する。したがって、例えば、1つの(a)「宿主細胞」への言及は、複数のこのような宿主細胞を包含する。   As used herein and in the appended claims, the singular terms “a”, “an”, and “the” are not expressly specified by context. Unless stated, it includes a reference to the plural. Thus, for example, reference to (a) “host cell” includes a plurality of such host cells.

別段の特定のない限り、それぞれ、核酸は左から右に、5’から3’への方向で記載されており、アミノ酸配列は左から右に、アミノからカルボキシへの方向に記載されている。   Unless otherwise specified, each nucleic acid is written left to right in a 5 'to 3' direction, and the amino acid sequence is written left to right in an amino to carboxy direction, respectively.

本明細書に提示される表題は、本明細書全体を参照することにより知ることができる本発明の様々な態様または実施形態を限定するものではない。したがって、以下に定義される用語は、本明細書全体を参照することによってより詳細に定義される。   The titles presented herein are not intended to limit the various aspects or embodiments of the present invention that can be known by reference to the entire specification. Accordingly, the terms defined below are defined in more detail by reference to the entire specification.

本明細書で使用される場合、「タンパク質」、「ポリペプチド」および「ペプチド」は、本明細書では、長さまたは翻訳後修飾(例えば、グリコシル化、リン酸化、脂質化、ミリスチル化、ユビキチン化など)にかかわらず、アミド結合によって共有結合的に連結された少なくとも2アミノ酸のポリマーを表すのに互換的に使用される。D−アミノ酸およびL−アミノ酸ならびにD−アミノ酸とL−アミノ酸との混合物は、この定義に含まれる。   As used herein, “protein”, “polypeptide” and “peptide” as used herein are length or post-translational modifications (eg, glycosylation, phosphorylation, lipidation, myristylation, ubiquitin Used interchangeably to denote a polymer of at least 2 amino acids covalently linked by an amide bond, regardless of D-amino acids and L-amino acids and mixtures of D-amino acids and L-amino acids are included in this definition.

本明細書で使用される場合、「ポリヌクレオチド」および「核酸」は、共有結合的に一緒に連結された2個以上のヌクレオシドを指す。ポリヌクレオチドは、リボヌクレオシドから完全に構成され得るか(すなわち、RNA)、2’デオキシリボヌクレオチドから完全に構成され得るか(すなわち、DNA)、またはリボヌクレオシドと2’デオキシリボヌクレオシドとの混合物であり得る。ヌクレオシドは一般に、標準的なホスホジエステル連結を介して一緒に連結されるが、ポリヌクレオチドは、1つ以上の非標準的な連結を含み得る。ポリヌクレオチドは、一本鎖もしくは二本鎖であり得るか、または一本鎖領域と二本鎖領域の両方を含み得る。さらに、ポリヌクレオチドは一般に、天然に存在するコード核酸塩基(すなわち、アデニン、グアニン、ウラシル、チミンおよびシトシン)から構成されるが、1つ以上の改変核酸塩基および/または合成核酸塩基(例えばイノシン、キサンチン、ヒポキサンチンなど)を含み得る。好ましくは、このような改変核酸塩基または合成核酸塩基は、コード核酸塩基である。   As used herein, “polynucleotide” and “nucleic acid” refer to two or more nucleosides covalently linked together. A polynucleotide can be composed entirely of ribonucleosides (ie, RNA), can be composed entirely of 2 ′ deoxyribonucleotides (ie, DNA), or can be a mixture of ribonucleosides and 2 ′ deoxyribonucleosides. . Nucleosides are generally linked together via standard phosphodiester linkages, but polynucleotides can contain one or more non-standard linkages. A polynucleotide can be single-stranded or double-stranded, or can comprise both single- and double-stranded regions. In addition, polynucleotides are generally composed of naturally occurring coding nucleobases (ie, adenine, guanine, uracil, thymine and cytosine), but one or more modified and / or synthetic nucleobases (eg, inosine, Xanthine, hypoxanthine, etc.). Preferably, such modified or synthetic nucleobase is a coding nucleobase.

本明細書で使用される場合、「ハイブリダイゼーションストリンジェンシー」は、核酸のハイブリダイゼーションにおける、洗浄条件などのハイブリダイゼーション条件に関する。一般に、ハイブリダイゼーション反応は、より低ストリンジェンシーの条件下で実施され、その後に、様々なストリンジェンシーではあるが、より高ストリンジェンシーの洗浄が続く。用語「中程度にストリンジェントなハイブリダイゼーション」は、標的DNAが、標的ポリヌクレオチドと約90%超の同一性を伴って、標的DNAと約60%の同一性、好ましくは、約75%の同一性、約85%の同一性を有する相補的核酸に結合するのを可能にする条件を指す。例示的な中程度にストリンジェントな条件は、42℃で、50%のホルムアミド、5×デンハート液、5×SSPE、0.2%のSDS中のハイブリダイゼーションと等価な条件であって、その後42℃で、0.2×SSPE、0.2%のSDS中の洗浄が続く。「高ストリンジェンシーハイブリダイゼーション」は、一般に、規定のポリヌクレオチド配列に対する溶液条件下で決定された熱的融解温度Tから約10℃またはそれよりも低い条件を指す。いくつかの実施形態では、高ストリンジェンシー条件は、65℃で、0.018MのNaCl中で安定なハイブリッドを形成する核酸配列のみのハイブリダイゼーションを可能にする条件を指す(すなわち、ハイブリッドが、65℃で、0.018MのNaCl中で安定ではない場合、これは、本明細書で意図されるように、高ストリンジェンシー条件下で安定ではない)。高ストリンジェンシー条件は、例えば、42℃で、50%のホルムアミド、5×デンハート液、5×SSPE、0.2%のSDSに等価な条件でのハイブリダイゼーション、その後の65℃で、0.1×SSPE、および0.1%のSDS中の洗浄によってもたらすことができる。別の高ストリンジェンシー条件は、65℃で、0.1%(w:v)のSDSを含有する5×SSC中でハイブリダイズすること、および65℃で、0.1%のSDSを含有する0.1×SSC中の洗浄と等価な条件でハイブリダイズすることである。他の高ストリンジェンシーハイブリダイゼーション条件、ならびに中程度にストリンジェントな条件は、当業者に公知である。 As used herein, “hybridization stringency” relates to hybridization conditions, such as wash conditions, in the hybridization of nucleic acids. In general, hybridization reactions are performed under conditions of lower stringency, followed by higher stringency washes, albeit at various stringencies. The term “moderately stringent hybridization” means that the target DNA is about 60% identical to the target DNA, preferably about 75% identical, with greater than about 90% identity to the target polynucleotide. Refers to conditions that allow binding to a complementary nucleic acid having about 85% identity. Exemplary moderately stringent conditions are those equivalent to hybridization in 50% formamide, 5 × Denhardt's solution, 5 × SSPE, 0.2% SDS at 42 ° C. Washing in 0.2 × SSPE, 0.2% SDS follows at 0 ° C. “High stringency hybridization” generally refers to conditions at or below about 10 ° C. from the thermal melting temperature T m determined under solution conditions for a defined polynucleotide sequence. In some embodiments, high stringency conditions refer to conditions that allow hybridization of only nucleic acid sequences that form stable hybrids in 0.018 M NaCl at 65 ° C. (ie, hybrids of 65 If it is not stable in 0.018M NaCl at 0 ° C., it is not stable under high stringency conditions as intended herein). High stringency conditions include, for example, hybridization at 42 ° C. under conditions equivalent to 50% formamide, 5 × Denhardt's solution, 5 × SSPE, 0.2% SDS, followed by 65 ° C. with 0.1% XSSPE, and can be brought about by washing in 0.1% SDS. Another high stringency condition is to hybridize in 5 × SSC containing 0.1% (w: v) SDS at 65 ° C. and contain 0.1% SDS at 65 ° C. Hybridization under conditions equivalent to washing in 0.1 × SSC. Other high stringency hybridization conditions, as well as moderately stringent conditions, are known to those skilled in the art.

本明細書で使用される場合、「コード配列」は、タンパク質のアミノ酸配列をコードする核酸(例えば、遺伝子)の部分を指す。   As used herein, “coding sequence” refers to the portion of a nucleic acid (eg, a gene) that encodes the amino acid sequence of a protein.

本明細書で使用される場合、「コドン最適化された」は、コードされたタンパク質が目的の生物内で効率的に発現されるように、タンパク質をコードするポリヌクレオチドのコドンが、特定の生物内で優先的に使用されるものへと変化することを指す。いくつかの実施形態では、PGA酵素をコードするポリヌクレオチドを、発現のために選択された宿主生物からの最適な産生のためにコドン最適化することができる。遺伝子コードは、ほとんどのアミノ酸が、「同義語」コドンまたは「同義」コドンと称されるいくつかのコドンによって表されるという点で縮重しているが、特定の生物によるコドン使用頻度(codon usage)は、非ランダムであり、特定のコドントリプレットに偏っていることが周知である。このコドン使用頻度バイアスは、所定の遺伝子、共通の機能または祖先起源の遺伝子、高度に発現されるタンパク質に関して、低コピー数タンパク質、および生物のゲノムの凝集タンパク質コード領域と比較して高くなり得る。いくつかの実施形態では、PGA酵素をコードするポリヌクレオチドを、発現のために選択された宿主生物からの最適な産生のためにコドン最適化することができる。   As used herein, “codon optimized” means that the codons of a polynucleotide encoding a protein are those of a particular organism, such that the encoded protein is efficiently expressed in the organism of interest. It means to change to the one that is used preferentially within. In some embodiments, a polynucleotide encoding a PGA enzyme can be codon optimized for optimal production from a host organism selected for expression. The genetic code is degenerate in that most amino acids are represented by several codons called “synonymous” codons or “synonymous” codons, but the codon usage by a particular organism (codon It is well known that usage) is non-random and biased to a specific codon triplet. This codon usage bias can be higher for a given gene, a gene of common function or ancestral origin, a highly expressed protein, and a low copy number protein, and an aggregated protein coding region of an organism's genome. In some embodiments, a polynucleotide encoding a PGA enzyme can be codon optimized for optimal production from a host organism selected for expression.

本明細書で使用される場合、「好ましい、最適な、高コドン使用頻度バイアスのコドン」は、同じアミノ酸をコードする他のコドンより、タンパク質コード領域において高い頻度で使用されるコドンを互換的に指す。好ましいコドンは、1個の遺伝子、共通の機能もしくは起源の一連の遺伝子、高度に発現された遺伝子におけるコドン使用頻度、生物全体の凝集タンパク質コード領域におけるコドン出現頻度(codon frequency)、関連生物の凝集タンパク質コード領域におけるコドン出現頻度、またはこれらの組み合わせに関して決定することができる。遺伝子発現のレベルと共にその頻度が増加するコドンは一般に、発現にとっての最適コドンである。例えばクラスター分析または対応分析を使用する多変量解析を含む、特定の生物におけるコドン出現頻度(例えば、コドン使用頻度、相対的同義コドン使用頻度)およびコドン優先度を決定するための様々な方法、ならびに、遺伝子において使用されるコドンの有効数を決定するための様々な方法が公知である(例えばGCG CodonPreference, Genetics Computer Group Wisconsin Package;CodonW、John Peden、University of Nottingham;McInerney、Bioinform.、14巻:372〜73頁、[1998年];Stenicoら、Nucleic Acids Res.、222巻:437〜46頁、[1994年];およびWright、Gene、87巻:23〜29頁、[1990年]を参照のこと)。拡大している生物リストについて、コドン使用頻度表が利用可能である(例えば、Wadaら、Nucleic Acids Res.、20巻:2111〜2118頁、[1992年];Nakamuraら、Nucl. Acids Res.、28巻:292頁、[2000年];Duretら、上記;HenautおよびDanchin、「Escherichia coli and Salmonella」、Neidhardtら(編)、ASM Press、Washington D.C.、[1996年]、2047〜2066年を参照のこと)。コドン使用頻度を得るためのデータソースは、タンパク質をコードすることができる任意の利用可能なヌクレオチド配列に依拠することができる。これらのデータセットは、発現タンパク質をコードすることが実際に公知である核酸配列(例えば、完全なタンパク質コード配列−CDS)、発現配列タグ(ESTS)、またはゲノム配列の予測されるコード領域を含む(例えば、Uberbacher、Meth. Enzymol.、266巻:259〜281頁、[1996年];Tiwariら、Comput. Appl. Biosci.、13巻:263〜270頁、[1997年]を参照のこと)。   As used herein, “preferred, optimal, high codon usage biased codon” refers to codons used more frequently in a protein coding region than other codons that encode the same amino acid. Point to. Preferred codons are one gene, a series of genes of common function or origin, codon usage in highly expressed genes, codon frequency in aggregated protein coding regions of the entire organism, aggregation of related organisms It can be determined with respect to the codon frequency in the protein coding region, or a combination thereof. Codons whose frequency increases with the level of gene expression is generally the optimal codon for expression. Various methods for determining codon frequency (eg, codon usage, relative synonymous codon usage) and codon preference in a particular organism, including multivariate analysis, eg, using cluster analysis or correspondence analysis, and Various methods are known for determining the effective number of codons used in a gene (eg GCG Codon Preference, Genetics Computer Group Wisconsin Package; Codon W, John Peden, University of Nottingham; McInerney, Bioinform., 14: 372-73, [1998]; Stenico et al., Nucleic Acids Res., 222: 437-46, [1994]; and Wright, Gene 87: 23-29, [1990]. ) For an expanding list of organisms, a codon usage frequency table is available (eg, Wada et al., Nucleic Acids Res., 20: 2111-2118, [1992]; Nakamura et al., Nucl. Acids Res., 28: 292, [2000]; see Duret et al., Supra; Henaut and Danchin, “Escherichia coli and Salmonella”, Neidhardt et al. (Ed.), ASM Press, Washington DC, [1996], 2047-2066. ) A data source for obtaining codon usage can rely on any available nucleotide sequence that can encode a protein. These data sets include the predicted coding region of a nucleic acid sequence that is actually known to encode the expressed protein (eg, complete protein coding sequence-CDS), expressed sequence tag (ESTS), or genomic sequence. (See, eg, Uberbacher, Meth. Enzymol., 266: 259-281, [1996]; Tiwari et al., Comput. Appl. Biosci., 13: 263-270, [1997]). .

本明細書で使用される場合、「制御配列」は、本明細書では、本開示のポリヌクレオチドおよび/またはポリペプチドの発現に必要または有利なすべての成分を含むように定義される。各制御配列は、目的のポリヌクレオチドにとって天然のものでも、外来のものでもあり得る。このような制御配列としては、限定されないが、リーダー、ポリアデニル化配列、プロペプチド配列、プロモーター、シグナルペプチド配列、および転写ターミネーターが挙げられる。   As used herein, a “control sequence” is defined herein to include all components necessary or advantageous for expression of the polynucleotides and / or polypeptides of the present disclosure. Each control sequence can be native or foreign to the polynucleotide of interest. Such control sequences include, but are not limited to, a leader, polyadenylation sequence, propeptide sequence, promoter, signal peptide sequence, and transcription terminator.

本明細書で使用される場合、「作動可能に連結された」は、本明細書では、制御配列が、目的のポリヌクレオチドに対してある位置で制御配列が適切に配置され(すなわち、機能的な関係で)、その結果、制御配列が、目的のポリヌクレオチドおよび/またはポリペプチドの発現を指示または調節する構成として定義される。   As used herein, “operably linked” is used herein to mean that the control sequence is suitably positioned at a position relative to the polynucleotide of interest (ie, functionally As a result, the regulatory sequence is defined as the configuration that directs or regulates the expression of the polynucleotide and / or polypeptide of interest.

本明細書で使用される場合、「プロモーター配列」は、コード配列などの目的のポリヌクレオチドの発現のために宿主細胞によって認識される核酸配列を指す。制御配列は、適切なプロモーター配列を含み得る。プロモーター配列は、転写制御配列を含有し、これは、目的のポリヌクレオチドの発現を媒介する。変異体プロモーター、短縮プロモーターおよびハイブリッドプロモーターを含むプロモーターは、選択される宿主細胞において転写活性を示す任意の核酸配列であり得、宿主細胞と同種または異種の細胞外ポリペプチドまたは細胞内ポリペプチドをコードする遺伝子から得られ得る。   As used herein, “promoter sequence” refers to a nucleic acid sequence that is recognized by a host cell for expression of a polynucleotide of interest, such as a coding sequence. The control sequence may include a suitable promoter sequence. The promoter sequence contains transcriptional control sequences that mediate expression of the polynucleotide of interest. A promoter, including mutant promoters, shortened promoters and hybrid promoters, can be any nucleic acid sequence that exhibits transcriptional activity in the selected host cell and encodes an extracellular or intracellular polypeptide that is homologous or heterologous to the host cell. Can be obtained from the gene

本明細書で使用される場合、「天然に存在する」または「野生型」は、天然に見られる形態を指す。例えば、天然に存在するかまたは野生型のポリペプチドまたはポリヌクレオチド配列は、生物中に存在する配列であって、天然の供給源から単離することができ、人為的操作によって意図的に改変されていない配列である。   As used herein, “naturally occurring” or “wild type” refers to the form found in nature. For example, a naturally occurring or wild-type polypeptide or polynucleotide sequence is a sequence that exists in an organism and can be isolated from a natural source and is intentionally modified by human manipulation. It is not an array.

本明細書で使用される場合、「天然に存在しない」、「組換え」または「人工」は、(例えば、細胞、核酸またはポリペプチド)に関して本開示において使用される場合、ある様式で改変された材料またはその材料の天然の形態もしくはネイティブな形態に対応する材料であって、改変のない場合には天然に存在しない材料を指す。いくつかの実施形態では、材料は、天然に存在する材料と同一であるが、合成物質からおよび/もしくは組換え技術を使用する操作によって生産もしくは生成された材料またはその材料の天然の形態もしくはネイティブな形態に対応する材料を指す。非限定的な例としては、特に、ネイティブな(非組換え)形態の細胞に見られない遺伝子を発現するか、または改変のない場合には異なるレベルで発現されるネイティブな遺伝子を発現する組換え細胞が挙げられる。   As used herein, “non-naturally occurring”, “recombinant” or “artificial”, when used in this disclosure with respect to (eg, a cell, nucleic acid or polypeptide), is modified in some manner. Or a material that corresponds to the natural or native form of the material and that does not exist in nature unless modified. In some embodiments, the material is the same as the naturally occurring material, but the material produced or produced from synthetic materials and / or by manipulation using recombinant techniques, or the natural form or native of that material Refers to a material corresponding to a particular form. Non-limiting examples include sets that express genes that are not found in native (non-recombinant) forms of cells, or that express native genes that are expressed at different levels in the absence of modification. Replacement cells can be mentioned.

本明細書で使用される場合、「配列同一性のパーセンテージ」、「パーセント同一性」および「パーセント同一」は、ポリヌクレオチド配列間またはおよびポリペプチド配列間の比較を指し、比較ウインドウにわたって最適にアライメントされた2つの配列を比較することによって決定され、比較ウインドウ内のポリヌクレオチドまたはポリペプチド配列の一部は、2つの配列の最適なアライメントの参照配列と比較して、付加または欠失(すなわち、ギャップ)を含み得る。両配列において同一の核酸塩基もしくはアミノ酸残基が存在するか、または核酸塩基もしくはアミノ酸残基がギャップとアライメントする位置の数を決定してマッチ位置の数を求め、マッチ位置の数を比較のウインドウ内の位置の総数で割り、その結果に100を乗じて配列同一性のパーセンテージを求めることによって、このパーセンテージを計算する
最適なアラインメントおよびパーセント配列同一性の決定は、BLASTおよびBLAST2.0アルゴリズムを使用して実施される(例えば、Altschulら、J. Mol. Biol.、215巻:403〜410頁、[1990年];およびAltschulら、Nucl. Acids Res.、3389〜3402頁、[1977年]を参照のこと)。BLAST分析を実施するためのソフトウェアは、National Center for Biotechnology Informationのウェブサイトを通じて公的に入手可能である。
As used herein, “percent sequence identity”, “percent identity” and “percent identity” refer to a comparison between polynucleotide sequences or between polypeptide sequences and optimal alignment over the comparison window. A portion of the polynucleotide or polypeptide sequence within the comparison window is compared to the reference sequence for optimal alignment of the two sequences, compared to the reference sequence in the optimal alignment of the two sequences (ie, Gap). Determine the number of match positions by determining the number of positions where the same nucleobase or amino acid residue is present in both sequences, or where the nucleobase or amino acid residue is aligned with the gap, and the number of match positions is the comparison window The best alignment and percent sequence identity determination to calculate this percentage by dividing by the total number of positions within and multiplying the result by 100 to determine the percentage of sequence identity uses the BLAST and BLAST 2.0 algorithms (Eg, Altschul et al., J. Mol. Biol., 215: 403-410, [1990]; and Altschul et al., Nucl. Acids Res., 3389-3402, [1977]. checking). Software for performing BLAST analyzes is publicly available through the National Center for Biotechnology Information website.

簡潔に言うと、BLAST分析は、データベース配列中の同じ長さのワードとアライメントされる場合、いくつかの正の値の閾値スコアTとマッチするかまたはこれを満たすクエリー配列中の短いワード長Wを同定することによって、高スコアの配列ペア(HSP)を最初に同定することを含む。Tは、隣接ワードスコア閾値と称される(Altschulら、同上)。これらの初期隣接ワードヒットは、これらを含有するさらに長いHSPを見つけるための検索を開始するためのシードとしての役割を果たす。次いで、累積アライメントスコアが増加し得る限り、このワードヒットを各配列に沿って両方向に拡大する。ヌクレオチド配列の場合、パラメータM(マッチング残基のペアの報酬スコア;常に>0)およびN(ミスマッチング残基のペナルティースコア;常に<0)を使用して、累積スコアを計算する。アミノ酸配列の場合、スコアリングマトリックスを使用して、累積スコアを計算する。累積アライメントスコアがその最大達成値から量Xだけ低下するか;負のスコア残基アライメントが1つ以上蓄積することにより、累積スコアが0以下になるか;またはいずれかの配列の末端に到達したら、ワードヒットの各方向への拡大を中止する。BLASTアルゴリズムパラメータW、TおよびXは、アライメントの感度およびスピードを決定する。BLASTNプログラム(ヌクレオチド配列の場合)は、デフォルトとして、11のワード長(W)、10の期待値(E)、M=5、N=−4、および両鎖の比較を使用する。アミノ酸配列の場合、BLASTPプログラムは、デフォルトとして、3のワード長(W)、10の期待値(E)、およびBLOSUM62スコアリングマトリックスを使用する(例えば、Henikoff and Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989]を参照のこと)。   Briefly, the BLAST analysis, when aligned with words of the same length in the database sequence, has a short word length W in the query sequence that matches or satisfies some positive threshold score T. First identifying a high-scoring sequence pair (HSP). T is referred to as the neighborhood word score threshold (Altschul et al., Ibid). These initial neighborhood word hits act as seeds for initiating searches to find longer HSPs containing them. The word hit is then expanded in both directions along each sequence as long as the cumulative alignment score can be increased. For nucleotide sequences, parameters M (matching residue pair reward score; always> 0) and N (mismatched residue penalty score; always <0) are used to calculate the cumulative score. For amino acid sequences, a scoring matrix is used to calculate the cumulative score. Whether the cumulative alignment score is reduced by an amount X from its maximum achieved value; by accumulating one or more negative score residue alignments, the cumulative score is less than zero; or when the end of any sequence is reached , Stop expanding word hits in each direction. The BLAST algorithm parameters W, T and X determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences) uses by default 11 word lengths (W), 10 expected values (E), M = 5, N = -4, and comparison of both strands. For amino acid sequences, the BLASTP program uses, by default, a word length of 3 (W), an expected value of 10 (E), and a BLOSUM62 scoring matrix (eg, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 [1989]).

2つの配列についてのパーセント同一性をもたらすことにおいてBLASTと同様に機能する多数の他のアルゴリズムが利用可能であり、当技術分野で公知である。比較のための配列の最適なアラインメントは、当技術分野で公知の任意の適切な方法を使用して(例えば、SmithおよびWaterman、Adv. Appl. Math.、2巻:482頁、[1981年]の局所相同性アルゴリズムによって;NeedlemanおよびWunsch、J. Mol. Biol.、48巻:443頁、[1970年]の相同性アラインメントアルゴリズムによって;PearsonおよびLipman、Proc. Natl. Acad. Sci. USA、85巻:2444頁、[1988年]の類似性調査法によって;ならびに/または、これらのアルゴリズムのコンピュータ制御による実行によって[GCG Wisconsin Software Package中のGAP、BESTFIT、FASTA、およびTFASTA])、または当技術分野で一般に公知の方法を使用した視覚的な検査によって行うことができる。さらに、配列アラインメントおよびパーセント配列同一性の決定には、GCG Wisconsin Software Package中のBESTFITまたはGAPプログラムを、提供されるデフォルトのパラメータを使用して用いることができる(Accelrys、Madison WI)。   Many other algorithms are available and are known in the art that function similarly to BLAST in providing percent identity for two sequences. Optimal alignment of sequences for comparison is performed using any suitable method known in the art (eg, Smith and Waterman, Adv. Appl. Math., 2: 482, [1981] By the homology alignment algorithm of Needleman and Wunsch, J. Mol. Biol., 48: 443, [1970]; Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85 Volume: 2444, [1988] by similarity studies; and / or by computer-controlled execution of these algorithms [GAP, BESTFIT, FASTA, and TFASTA in GCG Wisconsin Software Package]), or the technology By visual inspection using methods generally known in the field It kills. In addition, the BESTFIT or GAP program in the GCG Wisconsin Software Package can be used to determine sequence alignment and percent sequence identity using the default parameters provided (Accelrys, Madison WI).

本明細書で使用される場合、「実質的な同一性」は、少なくとも20残基位置の比較ウインドウにわたって、多くの場合には少なくとも30〜50残基のウインドウにわたって参照配列と比較される場合に、少なくとも80パーセントの配列同一性、少なくとも85パーセントの同一性、および89〜95パーセントの配列同一性、より通常には少なくとも99パーセントの配列同一性を有するポリヌクレオチドまたはポリペプチド配列を指し、配列同一性のパーセンテージは、参照配列を、比較のウインドウにわたって、合計で参照配列の20パーセント以下となる欠失または付加を含む配列と比較することによって計算される。ポリペプチドに適用される特定の実施形態では、用語「実質的な同一性」は、2つのポリペプチド配列が、デフォルトのギャップ重みを使用して、プログラムのGAPまたはBESTFITなどによって最適にアラインメントされる場合、少なくとも80パーセントの配列同一性、好ましくは少なくとも89パーセントの配列同一性、少なくとも95パーセントの配列同一性またはそれを超える配列同一性(例えば、99パーセントの配列同一性)を共有することを意味する。いくつかの好ましい実施形態では、同一ではない残基位置は、保存的アミノ酸置換によって異なる。   As used herein, “substantial identity” is when compared to a reference sequence over a comparison window of at least 20 residue positions, and often over a window of at least 30-50 residues. Refers to a polynucleotide or polypeptide sequence having at least 80 percent sequence identity, at least 85 percent identity, and 89-95 percent sequence identity, more usually at least 99 percent sequence identity. The percentage of sex is calculated by comparing the reference sequence to a sequence containing deletions or additions that total no more than 20 percent of the reference sequence over the window of comparison. In certain embodiments applied to polypeptides, the term “substantial identity” means that two polypeptide sequences are optimally aligned, such as by program GAP or BESTFIT, using default gap weights. Means sharing at least 80 percent sequence identity, preferably at least 89 percent sequence identity, at least 95 percent sequence identity or greater (eg, 99 percent sequence identity) To do. In some preferred embodiments, residue positions that are not identical differ by conservative amino acid substitutions.

本明細書で使用される場合、「参照配列」は、比較される別の配列に対する規定の配列を指す。参照配列は、より大きい配列のサブセット、例えば、全長遺伝子またはポリペプチド配列のセグメントであり得る。一般に、参照配列は、長さが少なくとも20のヌクレオチドもしくはアミノ酸残基、長さが少なくとも25残基、長さが少なくとも50残基、または核酸もしくはポリペプチドの全長である。2つのポリヌクレオチドまたはポリペプチドはそれぞれ、(1)2つの配列間で類似している配列(すなわち、完全な配列の部分)を含むことができ、(2)2つの配列で非常に異なる配列をさらに含むことができるので、一般には、比較ウインドウにわたる2つのポリヌクレオチドの配列を比較して局所領域の配列類似性を同定および比較することによって、2つ(またはそれ以上)のポリヌクレオチドまたはポリペプチドの間の配列比較を実施する。用語「参照配列」は、野生型配列に限定されるものではなく、操作または変更された配列を含み得る。例えば、いくつかの実施形態では、「参照配列」は、予め操作または変更されたアミノ酸配列であり得る。   As used herein, “reference sequence” refers to a defined sequence relative to another sequence to be compared. A reference sequence can be a subset of a larger sequence, eg, a segment of a full-length gene or polypeptide sequence. Generally, the reference sequence is at least 20 nucleotides or amino acid residues in length, at least 25 residues in length, at least 50 residues in length, or the full length of a nucleic acid or polypeptide. Each of the two polynucleotides or polypeptides can include (1) a sequence that is similar between the two sequences (ie, part of the complete sequence), and (2) a sequence that is very different between the two sequences. In general, two (or more) polynucleotides or polypeptides by comparing the sequence of two polynucleotides over a comparison window to identify and compare the sequence similarity of local regions A sequence comparison between is performed. The term “reference sequence” is not limited to wild-type sequences, but can include engineered or altered sequences. For example, in some embodiments, a “reference sequence” can be a pre-engineered or altered amino acid sequence.

本明細書で使用される場合、「比較ウインドウ」は、少なくとも約20の連続したヌクレオチド位置またはアミノ酸残基の概念上のセグメントを指し、配列は、少なくとも20の連続したヌクレオチドまたはアミノ酸の参照配列と比較することができ、比較ウインドウ中の配列の部分は、2つの配列の最適なアライメントに関して、(付加または欠失を含まない)参照配列と比較した場合に、20パーセント以下の付加または欠失(すなわち、ギャップ)を含み得る。比較ウインドウは、20より長い連続した残基であり得、場合により30、40、50、100またはそれ以上の長いウインドウを含む。   As used herein, a “comparison window” refers to a conceptual segment of at least about 20 consecutive nucleotide positions or amino acid residues, wherein the sequence is a reference sequence of at least 20 consecutive nucleotides or amino acids. The portion of the sequence in the comparison window can contain no more than 20 percent additions or deletions when compared to a reference sequence (not including additions or deletions) with respect to optimal alignment of the two sequences. That is, a gap) may be included. The comparison window may be consecutive residues longer than 20, optionally including 30, 40, 50, 100 or more long windows.

本明細書で使用される場合、「に対応する」、「を参照して」および「と比べて」は、所定のアミノ酸またはポリヌクレオチド配列の番号付けとの関連で使用される場合、所定のアミノ酸配列またはポリヌクレオチド配列が参照配列と比較される場合の、特定の参照配列の残基の番号付けを指す。換言すれば、所定のポリマーの残基番号または残基位置は、所定のアミノ酸配列またはポリヌクレオチド配列内の残基の実際の数値的な位置によってではなく、参照配列に対して指定される。例えば、人工PGAのアミノ酸配列などの所定のアミノ酸配列は、2つの配列間の残基マッチを最適化するためにギャップを導入することによって、参照配列に対してアライメントさせることができる。これらの場合では、ギャップが存在するが、所定のアミノ酸配列またはポリヌクレオチド配列における残基の番号付けは、この配列がアライメントされている参照配列に対して行われる。本明細書で使用される場合、下にさらに記載されている「Xn」などの残基位置への言及は、特に他に指示がなければ、「に対応する残基」への言及と解釈されるべきである。したがって、例えば、「X94」は、ポリペプチド配列の94位の任意のアミノ酸を指す。   As used herein, “corresponds to”, “with reference to” and “compared with” when used in the context of numbering a given amino acid or polynucleotide sequence Refers to the numbering of residues of a particular reference sequence when the amino acid sequence or polynucleotide sequence is compared to the reference sequence. In other words, the residue number or residue position of a given polymer is specified relative to a reference sequence, not by the actual numerical position of the residue within a given amino acid sequence or polynucleotide sequence. For example, a given amino acid sequence, such as the amino acid sequence of an artificial PGA, can be aligned to a reference sequence by introducing gaps to optimize residue matches between the two sequences. In these cases, there are gaps, but the numbering of the residues in a given amino acid sequence or polynucleotide sequence is performed with respect to the reference sequence to which this sequence is aligned. As used herein, references to residue positions such as “Xn” further described below are to be construed as references to “residues corresponding to” unless otherwise indicated. Should be. Thus, for example, “X94” refers to any amino acid at position 94 of a polypeptide sequence.

本明細書で使用される場合、「改善された酵素特性」は、参照PGAと比較した場合に、何らかの酵素特性の改善を示すPGAを指す。本明細書に記載される操作されたPGAポリペプチドについて、比較は一般に、野生型PGA酵素に対して行われるが、いくつかの実施形態では、参照PGAは、別の改善された操作されたPGAであり得る。改善が望まれる酵素特性としては、限定されないが、酵素活性(基質の、特定量のPGAを使用した、特定の反応時間での変換率の観点から表すことができる)、熱安定性、溶媒安定性、pH活性プロファイル、補因子要件、阻害剤(例えば、生成物阻害)に対する不応性、立体特異性、および立体選択性(エナンチオ選択性を含む)が挙げられる。   As used herein, “improved enzyme properties” refers to PGAs that exhibit some improvement in enzyme properties when compared to a reference PGA. For the engineered PGA polypeptides described herein, the comparison is generally made to the wild type PGA enzyme, but in some embodiments, the reference PGA is another improved engineered PGA. It can be. Enzymatic properties that are desired to be improved include, but are not limited to, enzyme activity (which can be expressed in terms of conversion rate of the substrate at a specific reaction time using a specific amount of PGA), thermal stability, solvent stability Sex, pH activity profile, cofactor requirements, refractory to inhibitors (eg, product inhibition), stereospecificity, and stereoselectivity (including enantioselectivity).

本明細書で使用される場合、「増加した酵素活性」は、操作されたPGAポリペプチドの改善された特性を指し、これは、参照PGA酵素と比較した、比活性(例えば、生成された生成物/時間/タンパク質の重量)の増加、または基質の生成物への変換率(例えば、出発量の基質の、特定量のPGAを使用した、特定の期間での生成物への変換率)の増加によって表すことができる。酵素活性を決定するための例示的な方法は、実施例において提供されている。K、Vmaxまたはkcatの古典的な酵素特性を含む酵素活性に関係する任意の特性が影響され得、その変化は酵素活性の増加をもたらし得る。酵素活性の改善は、対応する野生型PGA酵素の酵素活性の約1.5倍から、そのPGAポリペプチドが由来する天然に存在するPGA、または別の操作されたPGAよりも2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、またはそれを超える酵素活性までであり得る。特定の実施形態では、操作されたPGA酵素は、親PGA酵素の酵素活性の1.5〜50倍、1.5〜100倍の範囲の改善された酵素活性を示す。いずれの酵素の活性も拡散律速性(diffusion limited)であり、したがって、触媒ターンオーバー速度が、任意の必要な補因子を含む基質の拡散速度を超えることはできないことが当業者には理解される。拡散律速またはkcat/Kの理論的最大値は、一般に、約10〜10(M−1−1)である。したがって、PGAのいかなる酵素活性の改善にも、PGA酵素による作用を受ける基質の拡散速度に関連する上限がある。PGA活性は、力価測定(titration)によるものなどの、ペニシリンGの切断時のフェニル酢酸の放出を測定するために使用される標準的なアッセイのいずれか1つによって測定することができる(例えば、SimonsおよびGibson、Biotechnol. Tech.、13巻:365〜367頁、[1999年]を参照のこと)。いくつかの実施形態では、PGA活性は、切断生成物である5−アミノ−2−ニトロ−安息香酸が分光光度的に検出可能な(λmax=405nm)6−ニトロフェニルアセトアミド安息香酸(NIPAB)を使用することによって測定することができる。酵素活性の比較は、本明細書においてさらに詳細に記載されるように、酵素の規定の調製、所定の条件下での規定のアッセイ、および1つ以上の規定の基質を使用して行われる。一般に、溶解産物が比較される場合、宿主細胞によって産生され、溶解産物中に存在する酵素の量の変動を最小限にするために、同一の発現系および同一の宿主細胞が使用されると共に、細胞数およびアッセイされるタンパク質の量が決定される。 As used herein, “increased enzyme activity” refers to an improved property of an engineered PGA polypeptide that is specific activity (eg, produced product) compared to a reference PGA enzyme. Product / time / protein weight) or conversion of substrate to product (eg, conversion of starting substrate to product over a specific period of time using a specific amount of PGA) Can be represented by an increase. Exemplary methods for determining enzyme activity are provided in the examples. Any property related to enzyme activity, including the classical enzyme properties of K m , V max or k cat , can be affected and the change can lead to an increase in enzyme activity. The improvement in enzyme activity is from about 1.5 times the enzyme activity of the corresponding wild-type PGA enzyme, 2 to 5 times over the naturally occurring PGA from which the PGA polypeptide is derived, or another engineered PGA. It can be up to 10 times, 20 times, 25 times, 50 times, 75 times, 100 times or even more enzyme activity. In certain embodiments, the engineered PGA enzyme exhibits improved enzyme activity in the range of 1.5-50 times, 1.5-100 times that of the parent PGA enzyme. Those skilled in the art will appreciate that the activity of either enzyme is diffusion limited and therefore the catalytic turnover rate cannot exceed the diffusion rate of the substrate containing any necessary cofactors. . The theoretical maximum of diffusion limited or k cat / K m is generally about 10 8 to 10 9 (M −1 s −1 ). Thus, any improvement in the enzymatic activity of PGA has an upper limit related to the diffusion rate of the substrate affected by the PGA enzyme. PGA activity can be measured by any one of the standard assays used to measure the release of phenylacetic acid upon cleavage of penicillin G, such as by titration (eg, by titration). Simons and Gibson, Biotechnol. Tech., 13: 365-367, [1999]). In some embodiments, PGA activity is determined by the cleavage product 5-amino-2-nitro-benzoic acid, which is spectrophotometrically detectable (λmax = 405 nm) 6-nitrophenylacetamide benzoic acid (NIPAB). It can be measured by using. The comparison of enzyme activity is performed using a defined preparation of the enzyme, a defined assay under certain conditions, and one or more defined substrates, as described in further detail herein. In general, when lysates are compared, the same expression system and the same host cell are used to minimize variation in the amount of enzyme produced by the host cell and present in the lysate, The number of cells and the amount of protein assayed are determined.

本明細書で使用される場合、「増加した酵素活性」および「増加した活性」は、操作された酵素の改善された特性を指し、これは、本明細書に記載される参照酵素と比較して、比活性(例えば、生成された生成物/時間/タンパク質の重量)の増加または基質の生成物への変換率(例えば、出発量の基質の、特定量のPGAを使用した、特定の期間での生成物への変換率)の増加によって表すことができる。K、Vmaxまたはkcatの古典的な酵素特性を含む酵素活性に関係する任意の特性が影響され得、その変化は酵素活性の増加をもたらし得る。いくつかの実施形態では、本明細書に提示されるPGA酵素は、インスリンの特定の残基からトリフェニル酢酸保護基を除去することによってインスリンを放出させる。酵素活性の比較は、本明細書においてさらに詳細に記載されるように、酵素の規定の調製、所定の条件下での規定のアッセイ、および1つ以上の規定の基質を使用して行われる。一般に、細胞溶解産物中の酵素が比較される場合、宿主細胞によって産生され、溶解産物中に存在する酵素の量の変動を最小限にするために、同一の発現系および同一の宿主細胞が使用されると共に、細胞数およびアッセイされるタンパク質の量が決定される。 As used herein, “increased enzyme activity” and “increased activity” refer to improved properties of the engineered enzyme compared to the reference enzyme described herein. Specific activity (eg, product produced / time / weight of protein) or conversion rate of substrate to product (eg, starting amount of substrate using a specific amount of PGA for a specific period of time (Conversion rate to product). Any property related to enzyme activity, including the classical enzyme properties of K m , V max or k cat , can be affected and the change can lead to an increase in enzyme activity. In some embodiments, the PGA enzymes presented herein release insulin by removing a triphenylacetic acid protecting group from a particular residue of insulin. The comparison of enzyme activity is performed using a defined preparation of the enzyme, a defined assay under certain conditions, and one or more defined substrates, as described in further detail herein. In general, when enzymes in cell lysates are compared, the same expression system and the same host cell are used to minimize variation in the amount of enzyme produced by the host cell and present in the lysate. In addition, the number of cells and the amount of protein assayed are determined.

本明細書で使用される場合、「変換」は、基質の対応する生成物への酵素的転換を指す。   As used herein, “conversion” refers to the enzymatic conversion of a substrate to the corresponding product.

本明細書で使用される場合、「変換率」は、特定条件下である時間の期間内に生成物に変換される基質のパーセントを指す。したがって、例えば、PGAポリペプチドの「酵素活性」または「活性」は、基質の生成物への「変換率」として表すことができる。   As used herein, “conversion” refers to the percentage of substrate that is converted to product within a period of time under certain conditions. Thus, for example, the “enzymatic activity” or “activity” of a PGA polypeptide can be expressed as the “conversion rate” of a substrate to a product.

本明細書で使用される場合、「化学選択性」は、化学反応または酵素反応において、ある1つの生成物が別の生成物よりも優先的に形成されることを指す。   As used herein, “chemoselectivity” refers to the formation of one product preferentially over another in a chemical or enzymatic reaction.

本明細書で使用される場合、「熱安定(thermostable)」および「熱安定(thermal stable)」は、一定期間(例えば、0.5〜24時間)にわたって一連の温度条件(例えば、40〜80℃)に曝露したときに、無処理の酵素と比較して、不活化に対して耐性であり、したがって、温度の上昇に曝露した後にある特定のレベルの残留活性(例えば、60%超〜80%)を保持するポリペプチドを指すのに互換的に使用される。   As used herein, “thermostable” and “thermal stable” are a series of temperature conditions (eg, 40-80) over a period of time (eg, 0.5-24 hours). When exposed to a certain level of residual activity (eg, greater than 60% to 80%) after exposure to elevated temperatures. %) Are used interchangeably.

本明細書で使用される場合、「溶媒安定(solvent stable)」は、様々な濃度(例えば、5〜99%)の溶媒(例えば、イソプロピルアルコール、テトラヒドロフラン、2−メチルテトラヒドロフラン、アセトン、トルエン、酢酸ブチル、メチルtert−ブチルエーテルなど)に、一定期間(例えば、0.5〜24時間)曝露した後、無処理の酵素と比較して同様の活性(例えば、例えば、60%〜80%超)を維持するポリペプチドの能力を指す。   As used herein, “solvent stable” refers to various concentrations (eg, 5-99%) of solvents (eg, isopropyl alcohol, tetrahydrofuran, 2-methyltetrahydrofuran, acetone, toluene, acetic acid). Butyl, methyl tert-butyl ether, etc.) after exposure for a period of time (e.g. 0.5-24 hours) followed by similar activity (e.g. Refers to the ability of a polypeptide to maintain.

本明細書で使用される場合、「pH安定」は、高pHまたは低pH(例えば、4.5〜6または8〜12)に、一定期間(例えば、0.5〜24時間)曝露した後、無処理の酵素と比較して同様の活性(例えば、60%超〜80%)を維持するPGAポリペプチドを指す。   As used herein, “pH stable” means after exposure to high or low pH (eg, 4.5-6 or 8-12) for a period of time (eg, 0.5-24 hours). , Refers to PGA polypeptides that maintain similar activity (eg, greater than 60% to 80%) compared to untreated enzyme.

本明細書で使用される場合、「熱および溶媒安定」は、熱安定(thermostable)および溶媒安定の両方であるPGAポリペプチドを指す。   As used herein, “thermal and solvent stable” refers to a PGA polypeptide that is both thermostable and solvent stable.

本明細書で使用される場合、「親水性アミノ酸または残基」は、Eisenbergらの正規化されたコンセンサス疎水性尺度(Eisenbergら、J. Mol. Biol.、179巻:125〜142頁、[1984年])に従って0未満の疎水性を示す側鎖を有するアミノ酸または残基を指す。遺伝子によってコードされる親水性アミノ酸としては、L−Thr(T)、L−Ser(S)、L−His(H)、L−Glu(E)、L−Asn(N)、L−Gln(Q)、L−Asp(D)、L−Lys(K)およびL−Arg(R)が挙げられる。   As used herein, “hydrophilic amino acid or residue” refers to the normalized consensus hydrophobicity scale of Eisenberg et al. (Eisenberg et al., J. Mol. Biol. 179: 125-142, [ 1984]) refers to an amino acid or residue having a side chain exhibiting a hydrophobicity of less than 0. The hydrophilic amino acid encoded by the gene includes L-Thr (T), L-Ser (S), L-His (H), L-Glu (E), L-Asn (N), L-Gln ( Q), L-Asp (D), L-Lys (K) and L-Arg (R).

本明細書で使用される場合、「酸性アミノ酸または残基」は、アミノ酸がペプチドまたはポリペプチド中に含まれる場合に約6未満のpK値を示す側鎖を有する親水性アミノ酸または残基を指す。酸性アミノ酸は、一般には、生理的pHにおいて、水素イオンの喪失に起因して、負に荷電した側鎖を有する。遺伝子によってコードされる酸性アミノ酸としては、L−Glu(E)およびL−Asp(D)が挙げられる。   As used herein, “acidic amino acid or residue” refers to a hydrophilic amino acid or residue having a side chain that exhibits a pK value of less than about 6 when the amino acid is included in a peptide or polypeptide. . Acidic amino acids generally have negatively charged side chains due to loss of hydrogen ions at physiological pH. Acidic amino acids encoded by the gene include L-Glu (E) and L-Asp (D).

本明細書で使用される場合、「塩基性アミノ酸または残基」は、アミノ酸がペプチドまたはポリペプチド中に含まれる場合に、約6超のpK値を示す側鎖を有する親水性アミノ酸または残基を指す。塩基性アミノ酸は、一般には、生理的pHにおいて、ヒドロニウムイオンとの会合に起因して、正に荷電した側鎖を有する。遺伝子によってコードされる塩基性アミノ酸としては、L−Arg(R)およびL−Lys(K)が挙げられる。   As used herein, a “basic amino acid or residue” is a hydrophilic amino acid or residue having a side chain that exhibits a pK value greater than about 6 when the amino acid is included in a peptide or polypeptide. Point to. Basic amino acids generally have positively charged side chains due to association with hydronium ions at physiological pH. Examples of basic amino acids encoded by the gene include L-Arg (R) and L-Lys (K).

本明細書で使用される場合、「極性アミノ酸または残基」は、生理的pHにおいて非荷電であるが、2つの原子に共有される電子対が、原子のうちの1つによってより密接に保持される結合を少なくとも1つ有する側鎖を有する親水性アミノ酸または残基を指す。遺伝子によってコードされる極性アミノ酸としては、L−Asn(N)、L−Gln(Q)、L−Ser(S)およびL−Thr(T)が挙げられる。   As used herein, a “polar amino acid or residue” is uncharged at physiological pH, but the electron pair shared by two atoms is more closely held by one of the atoms It refers to a hydrophilic amino acid or residue having a side chain with at least one bond. The polar amino acids encoded by the gene include L-Asn (N), L-Gln (Q), L-Ser (S) and L-Thr (T).

本明細書で使用される場合、「疎水性アミノ酸または残基」は、Eisenbergらの正規化されたコンセンサス疎水性尺度(Eisenbergら、J. Mol. Biol.、179巻:125〜142頁、[1984年])に従って0よりも大きな疎水性を示す側鎖を有するアミノ酸または残基を指す。遺伝子によってコードされる疎水性アミノ酸としては、L−Pro(P)、L−Ile(I)、L−Phe(F)、L−Val(V)、L−Leu(L)、L−Trp(W)、L−Met(M)、L−Ala(A)およびL−Tyr(Y)が挙げられる。   As used herein, “hydrophobic amino acids or residues” refers to the Eisenberg et al. Normalized consensus hydrophobicity scale (Eisenberg et al., J. Mol. Biol. 179: 125-142, [ 1984]) refers to an amino acid or residue having a side chain that exhibits a hydrophobicity greater than zero. Hydrophobic amino acids encoded by genes include L-Pro (P), L-Ile (I), L-Phe (F), L-Val (V), L-Leu (L), L-Trp ( W), L-Met (M), L-Ala (A) and L-Tyr (Y).

本明細書で使用される場合、「芳香族アミノ酸または残基」は、少なくとも1つの芳香族または芳香族複素環を含む側鎖を有する親水性または疎水性アミノ酸または残基を指す。遺伝子によってコードされる芳香族アミノ酸としては、L−Phe(F)、L−Tyr(Y)およびL−Trp(W)が挙げられる。L−His(H)は、芳香族複素環の窒素原子のpKaに基づいて時には塩基性残基に分類される、または、側鎖が芳香族複素環を含むことに起因して芳香族残基に分類されるが、本明細書では、ヒスチジンは、親水性残基または「拘束された残基(constrained residue)」(以下を参照のこと)に分類される。   As used herein, “aromatic amino acid or residue” refers to a hydrophilic or hydrophobic amino acid or residue having a side chain comprising at least one aromatic or aromatic heterocycle. Aromatic amino acids encoded by the gene include L-Phe (F), L-Tyr (Y) and L-Trp (W). L-His (H) is sometimes classified as a basic residue based on the pKa of the nitrogen atom of the aromatic heterocycle, or an aromatic residue due to the side chain containing an aromatic heterocycle However, as used herein, histidine is classified as a hydrophilic residue or “constrained residue” (see below).

本明細書で使用される場合、「拘束されたアミノ酸または残基」は、拘束された幾何学的形状を有するアミノ酸または残基を指す。本明細書では、拘束された残基として、L−Pro(P)およびL−His(H)が挙げられる。ヒスチジンは、比較的小さなイミダゾール環を有するので、拘束された幾何学的形状を有する。プロリンも同様に、5員環を有するので、拘束された幾何学的形状を有する。   As used herein, “constrained amino acid or residue” refers to an amino acid or residue having a constrained geometry. As used herein, constrained residues include L-Pro (P) and L-His (H). Histidine has a constrained geometry because it has a relatively small imidazole ring. Proline also has a constrained geometric shape because it has a five-membered ring.

本明細書で使用される場合、「非極性アミノ酸または残基」は、生理的pHにおいて非荷電であり、2つの原子に共有される電子対が、一般に、2つの原子のそれぞれによって同等に保持される結合を有する側鎖を有する(すなわち、側鎖が極性でない)疎水性アミノ酸または残基を指す。遺伝子によってコードされる非極性アミノ酸としては、L−Gly(G)、L−Leu(L)、L−Val(V)、L−Ile(I)、L−Met(M)およびL−Ala(A)が挙げられる。   As used herein, a “nonpolar amino acid or residue” is uncharged at physiological pH, and an electron pair shared by two atoms is generally held equally by each of the two atoms. Refers to a hydrophobic amino acid or residue having a side chain with a bond that is made (ie, the side chain is not polar). Nonpolar amino acids encoded by genes include L-Gly (G), L-Leu (L), L-Val (V), L-Ile (I), L-Met (M) and L-Ala ( A).

本明細書で使用される場合、「脂肪族アミノ酸または残基」は、脂肪族炭化水素側鎖を有する疎水性アミノ酸または残基を指す。遺伝子によってコードされる脂肪族アミノ酸としては、L−Ala(A)、L−Val(V)、L−Leu(L)およびL−Ile(I)が挙げられる。   As used herein, “aliphatic amino acid or residue” refers to a hydrophobic amino acid or residue having an aliphatic hydrocarbon side chain. Aliphatic amino acids encoded by the gene include L-Ala (A), L-Val (V), L-Leu (L) and L-Ile (I).

システイン(または「L−Cys」もしくは「[C]」)は他のL−Cys(C)アミノ酸または他のスルファニル含有アミノ酸もしくはスルフヒドリル含有アミノ酸とジスルフィド架橋を形成し得るという点で、普通ではないことに留意する。「システイン様残基」として、システインおよびジスルフィド架橋の形成に利用可能なスルフヒドリル部分を含有する他のアミノ酸が挙げられる。L−Cys(C)(および−SHを含有する側鎖を有する他のアミノ酸)の、ペプチド内に、還元型遊離−SHまたは酸化型ジスルフィド架橋形態のいずれかで存在する能力は、L−Cys(C)がペプチドへの正味の疎水性または親水性特徴に寄与するかどうかに影響を及ぼす。L−Cys(C)は、Eisenbergの正規化されたコンセンサス尺度(Eisenbergら、1984年、上記)に従って0.29の疎水性を示すが、本開示の目的に関しては、L−Cys(C)は、独自の群にカテゴリー化されることが理解されるべきである。   Cysteine (or “L-Cys” or “[C]”) is unusual in that it can form disulfide bridges with other L-Cys (C) amino acids or other sulfanyl-containing or sulfhydryl-containing amino acids. Keep in mind. “Cysteine-like residues” include cysteine and other amino acids containing sulfhydryl moieties that can be used to form disulfide bridges. The ability of L-Cys (C) (and other amino acids with side chains containing -SH) to be present in the peptide in either reduced free -SH or oxidized disulfide bridged form is determined by the L-Cys Affects whether (C) contributes to the net hydrophobic or hydrophilic character of the peptide. L-Cys (C) exhibits a hydrophobicity of 0.29 according to Eisenberg's normalized consensus scale (Eisenberg et al., 1984, supra), but for the purposes of this disclosure, L-Cys (C) It should be understood that they are categorized into their own groups.

本明細書で使用される場合、「小型アミノ酸または残基」は、全部で3つまたはそれ未満の炭素および/またはヘテロ原子(α−炭素および水素を除いて)で構成される側鎖を有するアミノ酸または残基を指す。小型アミノ酸または残基は、上記の定義に従って、脂肪族、非極性、極性または酸性の小型アミノ酸または残基にさらにカテゴリー化することができる。遺伝子によってコードされる小型アミノ酸としては、L−Ala(A)、L−Val(V)、L−Cys(C)、L−Asn(N)、L−Ser(S)、L−Thr(T)およびL−Asp(D)が挙げられる。   As used herein, a “small amino acid or residue” has a side chain composed of a total of three or less carbon and / or heteroatoms (except α-carbon and hydrogen). Refers to an amino acid or residue. Small amino acids or residues can be further categorized into aliphatic, nonpolar, polar or acidic small amino acids or residues according to the definition above. Small amino acids encoded by genes include L-Ala (A), L-Val (V), L-Cys (C), L-Asn (N), L-Ser (S), L-Thr (T ) And L-Asp (D).

本明細書で使用される場合、「ヒドロキシルを含有するアミノ酸または残基」は、ヒドロキシル(−OH)部分を含有するアミノ酸を指す。遺伝子によってコードされるヒドロキシルを含有するアミノ酸としては、L−Ser(S)L−Thr(T)およびL−Tyr(Y)が挙げられる。   As used herein, “hydroxyl-containing amino acid or residue” refers to an amino acid containing a hydroxyl (—OH) moiety. Amino acids containing the hydroxyl encoded by the gene include L-Ser (S) L-Thr (T) and L-Tyr (Y).

本明細書で使用される場合、「アミノ酸差異」および「残基差異」は、参照配列中の対応する位置のアミノ酸残基と比べたポリペプチド配列の位置でのアミノ酸残基の差異を指す。アミノ酸差異の位置は一般に、本明細書では「Xn」(nは、残基差異が基づく参照配列における対応する位置を指す)と称される。例えば、「配列番号2と比較したX40位の残基差異」は、配列番号2の40位に対応するポリペプチド位置のアミノ酸残基の差異を指す。したがって、配列番号2の参照ポリペプチドが40位でヒスチジンを有する場合、「配列番号2と比較したX40位の残基差異」は、配列番号2の40位に対応するポリペプチドの位置でのヒスチジン以外の任意の残基のアミノ酸置換を指す。本明細書のほとんどの例では、ある位置における特定のアミノ酸残基差異は、「XnY」(「Xn」は、上記のように対応する位置を指定し、「Y」は、人工ポリペプチドに見られるアミノ酸(すなわち、参照ポリペプチド中と異なる残基)の一文字識別子である)として示される。一部の場合では、本開示はまた、慣例的な表示法「AnB」(Aは、参照配列中の残基の一文字識別子であり、「n」は、参照配列中の残基位置の番号であり、Bは、人工ポリペプチドの配列中の残基置換の一文字識別子である)によって表される特定のアミノ酸差異を提供する。いくつかの場合では、本開示のポリペプチドは、参照配列と比較して1個以上のアミノ酸残基差異を含み得、これは、参照配列と比較して残基差異が存在する特定の位置のリストによって示される。いくつかの実施形態では、ポリペプチドの特定の残基位置に1個超のアミノ酸を使用することができる場合、使用することができる様々なアミノ酸残基は、「/」によって区切られる(例えば、X192A/G)。本開示は、保存的アミノ酸置換および非保存的アミノ酸置換のいずれかまたはその両方を含む1個以上のアミノ酸差異を含む操作されたポリペプチド配列を包含する。本開示の配列表に含まれる特定の組換え炭酸脱水酵素ポリペプチドのアミノ酸配列は、開始メチオニン(M)残基を含む(すなわち、Mは残基位置1を表す)。しかし、この開始メチオニン残基は、開始メチオニン残基を欠くが他の点では酵素の特性を保持する成熟タンパク質を作製するために、例えば宿主細胞またはインビトロ翻訳系においてなど、生物学的プロセシング機構によって除去することができることが当業者には理解される。したがって、用語「Xn位における配列番号2と比較したアミノ酸残基差異」は、本明細書で使用される場合、開始メチオニンを欠くようにプロセシングされた参照配列内の「Xn」位または対応する位置(例えば、(X−1)n位)を指し得る。   As used herein, “amino acid difference” and “residue difference” refer to the difference in amino acid residue at a position in a polypeptide sequence compared to the amino acid residue at the corresponding position in a reference sequence. The position of the amino acid difference is generally referred to herein as “Xn”, where n refers to the corresponding position in the reference sequence on which the residue difference is based. For example, “residue difference at position X40 compared to SEQ ID NO: 2” refers to the difference in amino acid residue at the polypeptide position corresponding to position 40 of SEQ ID NO: 2. Thus, when the reference polypeptide of SEQ ID NO: 2 has histidine at position 40, the “residue difference at position X40 compared to SEQ ID NO: 2” is the histidine at the position of the polypeptide corresponding to position 40 of SEQ ID NO: 2. Refers to an amino acid substitution at any residue other than. In most examples herein, the specific amino acid residue difference at a position is “XnY” (where “Xn” designates the corresponding position as described above, and “Y” appears in the artificial polypeptide. As a single letter identifier (ie, a different residue than in the reference polypeptide). In some cases, the disclosure also provides the conventional notation “AnB” (A is a single letter identifier of a residue in the reference sequence, and “n” is the number of the residue position in the reference sequence. And B is a single letter identifier of a residue substitution in the sequence of the artificial polypeptide). In some cases, a polypeptide of the present disclosure may contain one or more amino acid residue differences compared to a reference sequence, which is at a particular position where there are residue differences compared to the reference sequence. Indicated by the list. In some embodiments, where more than one amino acid can be used at a particular residue position in a polypeptide, the various amino acid residues that can be used are separated by a “/” (eg, X192A / G). The present disclosure encompasses engineered polypeptide sequences that include one or more amino acid differences that include either or both conservative amino acid substitutions and non-conservative amino acid substitutions. The amino acid sequence of certain recombinant carbonic anhydrase polypeptides included in the sequence listing of the present disclosure includes an initiating methionine (M) residue (ie, M represents residue position 1). However, this initiating methionine residue may be removed by biological processing mechanisms, such as in host cells or in vitro translation systems, to create mature proteins that lack the initiating methionine residue but otherwise retain the properties of the enzyme. Those skilled in the art will appreciate that they can be removed. Thus, the term “amino acid residue difference compared to SEQ ID NO: 2 at position Xn” as used herein refers to the “Xn” position or corresponding position in a reference sequence that is processed to lack the starting methionine. (For example, (X-1) position n).

本明細書で使用される場合、用語「保存的アミノ酸置換」は、ある残基を、類似側鎖を有する残基の互換性を指し、したがって一般に、ポリペプチド中のアミノ酸を、同じかまたは類似の規定アミノ酸クラス内のアミノ酸で置換することを含む。一例として限定されないが、いくつかの実施形態では、脂肪族側鎖を有するアミノ酸は、別の脂肪族アミノ酸、例えば、アラニン、バリン、ロイシン、およびイソロイシンと置換し、ヒドロキシル側鎖を有するアミノ酸は、ヒドロキシル側鎖を有する別のアミノ酸、例えば、セリンおよびトレオニンと置換され、芳香族側鎖を有するアミノ酸は、芳香族側鎖を有する別のアミノ酸、例えば、フェニルアラニン、チロシン、トリプトファン、およびヒスチジンと置換され、塩基性側鎖を有するアミノ酸は、塩基性側鎖を有する別のアミノ酸、例えば、リジンおよびアルギニンと置換され、酸性側鎖を有するアミノ酸は、酸性側鎖を有する別のアミノ酸(例えば、アスパラギン酸またはグルタミン酸)と置換され、および/または、疎水性または親水性アミノ酸は、それぞれ別の疎水性または親水性アミノ酸と置換される。例示的な保存的置換を表1に提供する。
As used herein, the term “conservative amino acid substitution” refers to the interchangeability of a residue with a residue having a similar side chain, and thus generally the amino acid in a polypeptide is the same or similar. Substituting with an amino acid within the defined amino acid class. By way of example but not limitation, in some embodiments, an amino acid having an aliphatic side chain is substituted with another aliphatic amino acid, such as alanine, valine, leucine, and isoleucine, and an amino acid having a hydroxyl side chain is Another amino acid having a hydroxyl side chain, such as serine and threonine, is substituted, and an amino acid having an aromatic side chain is substituted with another amino acid having an aromatic side chain, such as phenylalanine, tyrosine, tryptophan, and histidine. An amino acid having a basic side chain is replaced with another amino acid having a basic side chain, such as lysine and arginine, and an amino acid having an acidic side chain is substituted with another amino acid having an acidic side chain (for example, aspartic acid Or glutamic acid) and / or hydrophobic or Aqueous amino acids are respectively replaced with another hydrophobic or hydrophilic amino acids. Exemplary conservative substitutions are provided in Table 1.

本明細書で使用される場合、「非保存的置換」は、ポリペプチド中のアミノ酸を、側鎖特性が顕著に異なるアミノ酸に置換することを指す。非保存的置換は、規定のグループ内ではなく規定のグループ間のアミノ酸を使用することができ、(a)置換(例えば、グリシンからプロリン)領域内のペプチド骨格の構造、(b)電荷もしくは疎水性、または(c)側鎖のバルクに影響を与える。一例として限定されないが、例示的な非保存的置換は、塩基性または脂肪族アミノ酸と置換された酸性アミノ酸、小さいアミノ酸と置換された芳香族アミノ酸、および疎水性アミノ酸と置換された親水性アミノ酸であり得る。   As used herein, “non-conservative substitution” refers to the replacement of an amino acid in a polypeptide with an amino acid having significantly different side chain properties. Non-conservative substitutions can use amino acids between defined groups rather than within defined groups: (a) the structure of the peptide backbone within the substitution (eg, glycine to proline) region, (b) charge or hydrophobicity Affects (c) side chain bulk. By way of example but not limitation, exemplary non-conservative substitutions include acidic amino acids substituted with basic or aliphatic amino acids, aromatic amino acids substituted with small amino acids, and hydrophilic amino acids substituted with hydrophobic amino acids. possible.

本明細書で使用される場合、「欠失」は、参照ポリペプチドから1つ以上のアミノ酸を除去することによる、ポリペプチドの改変を指す。欠失は、酵素活性を保持し、および/または人工酵素の改善された特性を保持しつつ、1アミノ酸以上、2アミノ酸以上、5アミノ酸以上、10アミノ酸以上、15アミノ酸以上または20アミノ酸以上の除去であって、ポリペプチドを構成する全アミノ酸数の10%までの除去、または参照酵素を構成する全アミノ酸数の20%までの除去を含み得る。欠失は、ポリペプチドの内部部分および/または末端部分を対象とするものであり得る。様々な実施形態では、欠失は連続的なセグメントを含み得るか、または不連続であり得る。   As used herein, “deletion” refers to a modification of a polypeptide by removing one or more amino acids from a reference polypeptide. Deletion removes 1 amino acid or more, 2 amino acids or more, 5 amino acids or more, 10 amino acids or more, 15 amino acids or more, or 20 amino acids or more while retaining enzyme activity and / or retaining the improved properties of the artificial enzyme. However, it may include removal of up to 10% of the total number of amino acids comprising the polypeptide, or removal of up to 20% of the total number of amino acids comprising the reference enzyme. Deletions can be directed to the internal and / or terminal portions of the polypeptide. In various embodiments, the deletion can include continuous segments or can be discontinuous.

本明細書で使用される場合、「挿入」は、参照ポリペプチドへと1つ以上のアミノ酸を付加することによる、ポリペプチドの改変を指す。いくつかの実施形態では、改善された人工PGA酵素は、天然に存在するPGAポリペプチドへの1アミノ酸以上の挿入、ならびに人工PGAポリペプチドへの1アミノ酸以上の挿入を含む。挿入は、ポリペプチドの内部部分にあり得るか、またはカルボキシ末端もしくはアミノ末端に対するものであり得る。当技術分野で公知であるように、本明細書で使用される挿入は、融合タンパク質を含む。天然ポリペプチドにおいて、挿入は、連続的なアミノ酸セグメントであり得るか、またはアミノ酸の1つ以上によって隔てられ得る。   As used herein, “insertion” refers to the modification of a polypeptide by adding one or more amino acids to a reference polypeptide. In some embodiments, the improved artificial PGA enzyme comprises one or more amino acid insertions into a naturally occurring PGA polypeptide, as well as one or more amino acid insertions into an artificial PGA polypeptide. The insertion can be at an internal portion of the polypeptide or can be to the carboxy terminus or amino terminus. As is known in the art, the insertions used herein include fusion proteins. In natural polypeptides, insertions can be contiguous amino acid segments or can be separated by one or more of the amino acids.

用語「アミノ酸置換セット」または「置換セット」は、参照配列と比較した、ポリペプチド配列内のアミノ酸置換の群を指す。置換セットは、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、またはそれを超えるアミノ酸置換を有し得る。いくつかの実施形態では、置換セットは、実施例において提示される表に列挙されている改変体PGAのいずれかに存在するアミノ酸置換のセットを指す。   The term “amino acid substitution set” or “substitution set” refers to a group of amino acid substitutions in a polypeptide sequence compared to a reference sequence. The replacement set is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, or There can be more amino acid substitutions. In some embodiments, a substitution set refers to the set of amino acid substitutions present in any of the variant PGAs listed in the tables presented in the examples.

本明細書で使用される場合、「断片」は、アミノ末端および/またはカルボキシ末端の欠失を有するが、残りのアミノ酸配列は、配列中の対応する位置と同一であるポリペプチドを指す。断片は、典型的には、全長PGAポリペプチ、例えば、配列番号2のポリペプチドの約80%、約90%、約95%、約98%または約99%を有し得る。いくつかの実施形態では、断片は、「生物学的に活性である」(すなわち、全長配列と同じ酵素活性を示す)。   As used herein, “fragment” refers to a polypeptide having an amino-terminal and / or carboxy-terminal deletion, but the remaining amino acid sequence being identical to the corresponding position in the sequence. Fragments can typically have about 80%, about 90%, about 95%, about 98% or about 99% of the full-length PGA polypeptide, eg, the polypeptide of SEQ ID NO: 2. In some embodiments, fragments are “biologically active” (ie, exhibit the same enzymatic activity as the full-length sequence).

本明細書で使用される場合、「単離されたポリペプチド」は、天然でそれに付随する他の混入物、例えば、タンパク質、脂質およびポリヌクレオチドから実質的に分離されたポリペプチドを指す。この用語は、その天然に存在する環境または発現系(例えば、宿主細胞またはインビトロ合成)から回収または精製されたポリペプチドを包含する。改善されたPGA酵素は、細胞内に存在し得るか、細胞培地中に存在し得るか、または様々な形態(例えば、溶解産物または単離された調製物)で調製され得る。したがって、いくつかの実施形態では、本開示の人工PGAポリペプチドは、単離されたポリペプチドであり得る。   As used herein, an “isolated polypeptide” refers to a polypeptide that is substantially separated from other contaminants that naturally accompany it, such as proteins, lipids and polynucleotides. The term encompasses polypeptides recovered or purified from their naturally occurring environment or expression system (eg, host cells or in vitro synthesis). Improved PGA enzymes can be present intracellularly, can be present in cell culture media, or can be prepared in various forms (eg, lysates or isolated preparations). Thus, in some embodiments, an artificial PGA polypeptide of the present disclosure can be an isolated polypeptide.

本明細書で使用される場合、「実質的に純粋なポリペプチド」は、そのポリペプチド種が存在する優勢種である(すなわち、モルまたは重量基準で、これが、組成物中の任意の他の個々の高分子種よりも豊富である)組成物を指し、一般に、目的種が、存在する高分子種の少なくとも約50モルパーセントまたは約50重量パーセントを構成する場合、実質的に精製された組成物である。一般に、実質的に純粋な人工PGAポリペプチド組成物は、この組成物中に存在するすべての高分子種の約60モル%または重量%以上、約70モル%または重量%以上、約80モル%または重量%以上、約90モル%または重量%以上、約95モル%または重量%以上、および約98モル%または重量%以上を含む。溶媒種、小分子(<500ダルトン)、および元素イオン種は、高分子種と見なされない。いくつかの実施形態では、単離された改善されたPGAポリペプチドは、実質的に純粋なポリペプチド組成物である。   As used herein, a “substantially pure polypeptide” is the predominant species in which the polypeptide species is present (ie, on a molar or weight basis, which is any other in the composition). Composition, which is more abundant than the individual polymer species), and generally a substantially purified composition when the target species comprises at least about 50 mole percent or about 50 weight percent of the polymer species present. It is a thing. In general, a substantially pure artificial PGA polypeptide composition is about 60 mol% or greater than or equal to about 70 mol% or greater than or equal to about 80 mol% of all macromolecular species present in the composition. Or about 90 mol% or more, or about 95 mol% or more, and about 98 mol% or more. Solvent species, small molecules (<500 Daltons), and elemental ion species are not considered high molecular species. In some embodiments, the isolated improved PGA polypeptide is a substantially pure polypeptide composition.

本明細書で使用される場合、核酸またはポリペプチドに関して使用される場合、用語「異種」は、通常は生物(例えば、野生型生物)によって発現および分泌されない配列を指す。いくつかの実施形態では、この用語は、通常天然に見いだされるものと同じ互いとの関係では見いだされない、あるいは、組換え操作されており、その結果、発現のレベル、または細胞内の他の核酸もしくは他の分子との物理的関係、または構造が通常天然に見いだされるものではない、2つまたはそれを超える部分配列を含む配列を包含する。例えば、異種核酸は、一般には、組換えによって作製され、天然に見いだされない様式で配置された無関係の遺伝子に由来する2つまたはそれを超える配列を有する(例えば、ベクターなどの発現カセットに挿入されたプロモーター配列に作動可能に連結された本発明の核酸オープンリーディングフレーム(ORF))。いくつかの実施形態では、「異種ポリヌクレオチド」は、実験室技術によって宿主細胞中に導入される任意のポリヌクレオチドを指し、宿主細胞から取り出され、実験室操作にかけられ、次いで宿主細胞中に再導入されるポリヌクレオチドを含む。   As used herein, the term “heterologous” when used with reference to nucleic acids or polypeptides refers to sequences that are not normally expressed and secreted by an organism (eg, a wild-type organism). In some embodiments, the term is not found in the same relationship to each other as normally found in nature, or has been engineered so that the level of expression or other in the cell Includes sequences comprising two or more subsequences whose physical relationship with a nucleic acid or other molecule or structure is not normally found in nature. For example, a heterologous nucleic acid generally has two or more sequences derived from unrelated genes that are produced recombinantly and arranged in a manner not found in nature (eg, inserted into an expression cassette such as a vector). A nucleic acid open reading frame (ORF) of the present invention operably linked to a designated promoter sequence). In some embodiments, “heterologous polynucleotide” refers to any polynucleotide introduced into a host cell by laboratory techniques, removed from the host cell, subjected to laboratory manipulation, and then re-introduced into the host cell. Including the polynucleotide to be introduced.

本明細書で使用される場合、「適切な反応条件」は、本開示のPGAポリペプチドがトリフェニル酢酸保護基を除去することによって遊離のインスリンを放出させることができる生体触媒反応溶液の条件(例えば、酵素負荷、基質負荷、補因子負荷、温度、pH、緩衝液、共溶媒などの範囲)を指す。例示的な「適切な反応条件」は本開示において提供されており、実施例によって例示されている。   As used herein, “appropriate reaction conditions” are those conditions of a biocatalytic reaction solution that allows the PGA polypeptide of the present disclosure to release free insulin by removing the triphenylacetic acid protecting group ( For example, enzyme loading, substrate loading, cofactor loading, temperature, pH, buffer, co-solvent, etc.). Exemplary “suitable reaction conditions” are provided in this disclosure and are exemplified by the examples.

本明細書で使用される場合、「化合物負荷」、「酵素負荷」または「補因子負荷」などの「負荷」は、反応開始時における反応混合物中の成分の濃度または量を指す。   As used herein, “load”, such as “compound load”, “enzyme load” or “cofactor load” refers to the concentration or amount of a component in the reaction mixture at the start of the reaction.

本明細書で使用される場合、生体触媒媒介プロセスとの関連における「基質」は、生体触媒が作用する化合物または分子を指す。   As used herein, “substrate” in the context of a biocatalyst-mediated process refers to a compound or molecule on which the biocatalyst acts.

本明細書で使用される場合、生体触媒媒介プロセスとの関連における「生成物」は、生体触媒が作用した結果生じる化合物または分子を指す。   As used herein, “product” in the context of a biocatalyst-mediated process refers to a compound or molecule resulting from the action of a biocatalyst.

本明細書で使用される場合、「平衡」は、化学反応または酵素反応の順方向速度定数および逆方向速度定数によって決定される、立体異性体の相互変換を含む化学反応または酵素反応(例えば、2つの種AおよびBの相互変換)において化学種の定常状態の濃度をもたらすプロセスを指す。   As used herein, “equilibrium” refers to a chemical or enzymatic reaction (eg, a stereoisomer interconversion, as determined by the forward and reverse rate constants of a chemical or enzymatic reaction (eg, Refers to a process that results in a steady state concentration of a chemical species in the interconversion of two species A and B).

本明細書で使用される場合、「アシラーゼ」および「アシルトランスフェラーゼ」は、アシル基を供与体から受容体に移行させてエステルまたはアミドを形成させることができる酵素を指すのに互換的に使用される。アシラーゼ媒介逆反応の結果、エステルまたはアミドが加水分解される。   As used herein, “acylase” and “acyltransferase” are used interchangeably to refer to an enzyme capable of transferring an acyl group from a donor to an acceptor to form an ester or amide. The As a result of the acylase-mediated reverse reaction, the ester or amide is hydrolyzed.

本明細書で使用される場合、「ペニシリンG」および「ベンジルペニシリン」は、(2S,5R,6R)−3,3−ジメチル−7−オキソ−6−(2−フェニルアセトアミド)−4−チア−1−アザビシクロ[3.2.0]ヘプタン−2−カルボン酸(C1618S)としても公知の抗生物質を指す。これは、グラム陽性生物に対して主に有効であるが、一部のグラム陰性生物もそれに対して感受性である。 As used herein, “penicillin G” and “benzylpenicillin” are (2S, 5R, 6R) -3,3-dimethyl-7-oxo-6- (2-phenylacetamido) -4-thia. -1-azabicyclo [3.2.0] also refers to known antibiotics as heptane-2-carboxylic acid (C 16 H 18 N 2 O 4 S). This is mainly effective against gram positive organisms, but some gram negative organisms are also sensitive to it.

本明細書で使用される場合、「ペニシリンGアシラーゼ」および「PGA」は、ペニシリンG(ベンジルペニシリン)のフェニル酢酸(PHA)および6−アミノペニシラン酸(6−APA)への切断を媒介する能力を有する酵素を指すのに互換的に使用される。いくつかの実施形態では、PGA活性は、モデル基質の切断、例えば、6−ニトロ−3−(フェニルアセトアミド)安息香酸のフェニル酢酸および5−アミノ−2−ニトロ−安息香酸への切断に基づくものであり得る。PGAはまた、アシル供与体のアシル基をアシル受容体に移行させる逆反応を行うこともできる。PGAは、本明細書で使用される場合、天然に存在する(野生型)PGA、ならびに人為的操作によって作製された1つ以上の操作されたポリペプチドを含む天然に存在しないPGA酵素を包含する。野生型PGA遺伝子は、54アミノ酸のスペーサー領域によって連結されたαサブユニット(23.8KDa)およびβサブユニット(62.2KDa)からなるヘテロ二量体である。スペーサー領域が存在することに起因して、活性なタンパク質を形成するためには自己プロセシングステップが必要である。   As used herein, “penicillin G acylase” and “PGA” mediate cleavage of penicillin G (benzylpenicillin) to phenylacetic acid (PHA) and 6-aminopenicillanic acid (6-APA). Used interchangeably to refer to a competent enzyme. In some embodiments, the PGA activity is based on cleavage of the model substrate, eg, cleavage of 6-nitro-3- (phenylacetamido) benzoic acid to phenylacetic acid and 5-amino-2-nitro-benzoic acid. It can be. PGA can also perform a reverse reaction that transfers the acyl group of the acyl donor to the acyl acceptor. PGA, as used herein, includes naturally occurring (wild-type) PGA as well as non-naturally occurring PGA enzymes that include one or more engineered polypeptides made by human manipulation. . The wild type PGA gene is a heterodimer consisting of an α subunit (23.8 KDa) and a β subunit (62.2 KDa) linked by a 54 amino acid spacer region. Due to the presence of the spacer region, a self-processing step is required to form an active protein.

本明細書で使用される場合、「アシル供与体」は、アシル基をアシル受容体に供与してエステルまたはアミドを形成させる、アシラーゼ基質の部分を指す。   As used herein, “acyl donor” refers to the portion of an acylase substrate that donates an acyl group to the acyl acceptor to form an ester or amide.

本明細書で使用される場合、「アシル受容体」は、アシル供与体のアシル基を受容してエステルまたはアミドを形成させる、アシラーゼ基質の部分を指す。   As used herein, “acyl acceptor” refers to the portion of an acylase substrate that accepts the acyl group of an acyl donor to form an ester or amide.

本明細書で使用される場合、「α鎖配列」は、配列番号2の27〜235位の残基に対応する(例えば、それに対して少なくとも85%の同一性を有する)アミノ酸配列を指す。本明細書で使用される場合、単鎖のポリペプチドは、「α鎖配列」およびさらなる配列(複数可)を含み得る。   As used herein, “α chain sequence” refers to an amino acid sequence that corresponds to residues 27-235 of SEQ ID NO: 2 (eg, has at least 85% identity thereto). As used herein, a single chain polypeptide may include an “alpha chain sequence” and additional sequence (s).

本明細書で使用される場合、「β鎖配列」は、配列番号2の290〜846位の残基に対応する(例えば、それに対して少なくとも85%の同一性を有する)アミノ酸配列を指す。本明細書で使用される場合、単鎖のポリペプチドは、「β鎖配列」およびさらなる配列(複数可)を含み得る。   As used herein, “β chain sequence” refers to an amino acid sequence corresponding to (eg, having at least 85% identity to) residues 290-846 of SEQ ID NO: 2. As used herein, a single chain polypeptide may comprise a “β chain sequence” and additional sequence (s).

本明細書で使用される場合、操作されたPGA酵素との関連において使用される「に由来する」は、操作がそれに基づく、起源のPGA酵素、および/またはこのようなPGA酵素をコードする遺伝子を同定する。例えば、配列番号60の操作されたPGA酵素は、配列番号2のK.citrophila PGA α−鎖およびβ−鎖配列をコードする遺伝子を多数の世代にわたって人工的に進化させることによって得たものである。したがって、この操作されたPGA酵素は、配列番号2の天然に存在するまたは野生型PGA「に由来する」。   As used herein, “derived from” as used in the context of an engineered PGA enzyme is the PGA enzyme from which the operation is based, and / or a gene encoding such a PGA enzyme. Is identified. For example, the engineered PGA enzyme of SEQ ID NO: 60 is It was obtained by artificially evolving genes encoding citrophila PGA α- and β-chain sequences over many generations. Thus, this engineered PGA enzyme is “derived from” the naturally occurring or wild type PGA of SEQ ID NO: 2.

本明細書で使用される場合、「インスリン」は、正常な個体において膵臓のβ細胞によって産生されるポリペプチドホルモンを指す。インスリンは、血中グルコースレベルを低下させることによって炭水化物代謝を調節するために必要である。インスリンの系統的欠損により、糖尿病が生じる。インスリンは、51アミノ酸で構成され、およそ5800ダルトンの分子量を有する。インスリンは、2つのペプチド鎖(「A」および「B」で示される)で構成され、サブユニット内ジスルフィド結合を1つとサブユニット間ジスルフィド結合を2つ含有する。A鎖は21アミノ酸で構成され、B鎖は30アミノ酸で構成される。2つの鎖は、高度に規則的な構造を形成し、A鎖とB鎖の両方にα−ヘリックス領域をいくつか伴う。単離された鎖は不活性である。溶液中では、インスリンは、単量体、二量体、または六量体である。インスリンは、皮下注射のために使用される高度に濃縮された調製物中では六量体であるが、体液中で希釈されるにしたがって単量体になる。この定義は、プロインスリン、ならびに、天然に存在するインスリンの主要な構造的立体配座の一部または全部および生物学的特性の少なくとも1つを有する任意の精製された単離されたポリペプチドを包含することが意図されている。さらに、グリコフォームを含む、天然のインスリンおよび合成により作られたインスリン、ならびに類似体(例えば、欠失、挿入、および/または置換を有するポリペプチド)を包含することが意図されている。   As used herein, “insulin” refers to a polypeptide hormone produced by pancreatic β cells in normal individuals. Insulin is necessary to regulate carbohydrate metabolism by lowering blood glucose levels. Diabetes is caused by a systemic deficiency of insulin. Insulin is composed of 51 amino acids and has a molecular weight of approximately 5800 daltons. Insulin is composed of two peptide chains (denoted by “A” and “B”) and contains one intrasubunit disulfide bond and two intersubunit disulfide bonds. The A chain is composed of 21 amino acids, and the B chain is composed of 30 amino acids. The two chains form a highly ordered structure with some α-helix regions in both the A and B chains. The isolated strand is inactive. In solution, insulin is monomeric, dimeric, or hexameric. Insulin is a hexamer in highly concentrated preparations used for subcutaneous injection, but becomes monomeric as it is diluted in body fluids. This definition refers to proinsulin and any purified isolated polypeptide having at least one of the major structural conformations and at least one biological property of naturally occurring insulin. It is intended to include. Furthermore, it is intended to encompass natural and synthetically produced insulin, including glycoforms, and analogs (eg, polypeptides having deletions, insertions, and / or substitutions).

インスリンは、フェニル酢酸供与体と潜在的に反応し得、PGAによって脱保護され得る求核アミンを3つ含有する。これらの残基として、B鎖の29位(B29)のLysならびに2つのN末端遊離のアミン、A鎖の1位(A1)のGlyおよびB鎖の1位(B1)のPheが挙げられる。本発明は、3重保護インスリン(ヒトインスリンのA1残基、B1残基、B29残基にフェニル酢酸が化学的に結合している)を提供する。PGAは、N−フェニル酢酸で保護されたペプチドおよびインスリンの加水分解をフェニル酢酸アミド結合に対する排他的な選択性で触媒し、タンパク質の残りのペプチド結合はインタクトなまま残すことが以前に報告されている(Brtnikら、Coll. Czech. Chem. Commun.、46巻(8号)、1983〜1989頁、[1981年];およびWangら、Biopolym.、25巻(補遺)、S109〜S114頁、[1986年])。   Insulin contains three nucleophilic amines that can potentially react with phenylacetic acid donors and can be deprotected by PGA. These residues include Lys at position 29 of the B chain (B29) and two N-terminal free amines, Gly at position 1 of the A chain (A1) and Phe at position 1 of the B chain (B1). The present invention provides triple protected insulin (phenylacetic acid chemically bound to the A1, B1 and B29 residues of human insulin). PGA has previously been reported to catalyze the hydrolysis of N-phenylacetic acid protected peptides and insulin with exclusive selectivity for phenylacetamide bonds, leaving the remaining peptide bonds of the protein intact. (Brtnik et al., Coll. Czech. Chem. Commun., 46 (8), 1983-1989, [1981]; and Wang et al., Biopolym., 25 (supplement), S109-S114, [ 1986]).

本明細書で使用される場合、「トリフェニル酢酸保護基」は、本明細書に記載されるように、B1位、B29位およびA1位にフェニルアシル基で保護された3つの第一級アミンを有するインスリン分子を指す。   As used herein, a “triphenylacetic acid protecting group” refers to three primary amines protected with phenylacyl groups at the B1, B29 and A1 positions as described herein. Refers to an insulin molecule having

ペニシリンGアシラーゼ
ペニシリンアシラーゼは、SakaguchiおよびMuraoにより、Penicillium chrysogenum Wisc. Q176から最初に記載された(SakaguchiおよびMurao、J. Agr.Chem. Soc. Jpn.、23巻:411頁、[1950年])。ペニシリンGアシラーゼは、ペニシリンG、セファロスポリンG、および関連する抗生物質の側鎖に作用して、共通の副生成物としてフェニル酢酸を伴い、β−ラクタム系抗生物質中間体である6−アミノペニシラン酸および7−アミノデス−アセトキシセファロスポラン酸を生成させる加水分解酵素である。これらの抗生物質中間体としては、アンピシリン、アモキシシリン、クロキサシリン、セファレキシン、およびセフォタキシム(cefatoxime)などの、半合成抗生物質の潜在的な構成要素がある。
Penicillin G acylase Penicillin acylase was prepared by Sakaguchi and Murao, Penicillium chrysogenum Wisc. First described from Q176 (Sakaguchi and Murao, J. Agr. Chem. Soc. Jpn., 23: 411, [1950]). Penicillin G acylase acts on the side chains of penicillin G, cephalosporin G, and related antibiotics, with phenylacetic acid as a common by-product, and is a β-lactam antibiotic intermediate, 6-amino It is a hydrolase that produces penicillanic acid and 7-aminodes-acetoxycephalosporanic acid. These antibiotic intermediates include potential components of semisynthetic antibiotics such as ampicillin, amoxicillin, cloxacillin, cephalexin, and cefatoxime.

上に示されている通り、ペニシリンGアシラーゼ(PGA)は、スキーム1:
に示されている通り、構造式(I)の共役塩基を有するペニシリンGの、構造式(II)の共役塩基を有する6−アミノペニシラン酸および構造式(III)のフェニル酢酸への、加水分解による切断を触媒する能力によって特徴付けられる。
As shown above, penicillin G acylase (PGA) is represented by Scheme 1:
As shown in FIG. 4, the hydrolysis of penicillin G having a conjugate base of structural formula (I) into 6-aminopenicillanic acid having a conjugate base of structural formula (II) and phenylacetic acid of structural formula (III). Characterized by the ability to catalyze cleavage by degradation.

理論に縛られるものではないが、基質特異性は疎水性フェニル基の認識に関連すると思われ、一方、いくつかのPGAではβ鎖のN末端のセリン残基である求核試薬が、β−ラクタムおよびβアミノ酸などの様々な他の基の受容体として作用する。PGAは、また、スキーム2:
に示されている通り、ペニシリンGと類似しているモデル基質を切断する、例えば、構造式(IV)の6−ニトロ−3−(フェニルアセトアミド)安息香酸(NIPAB)を、構造式(III)のフェニル酢酸および構造式(V)の5−アミノ−2−ニトロ−安息香酸に切断する能力によっても特徴付けられ得る(例えば、Alkemaら、Anal. Biochem.、275巻:47〜53頁、[1999年]を参照のこと)。5−アミノ−2−ニトロ−安息香酸は発色性であるので、式(IV)の基質により、PGA活性を測定する便利な方法がもたらされる。前述の反応に加えて、PGAは、光学的に純粋なtertロイシンを調製するための、DL−tertロイシンの反応速度論的分解にも使用することができる(例えば、Liuら、Prep. Biochem. Biotechnol.、36巻:235〜41頁、[2006年]を参照のこと)。
Without being bound by theory, substrate specificity appears to be related to the recognition of hydrophobic phenyl groups, whereas in some PGA nucleophiles, which are serine residues at the N-terminus of the β chain, are β- Acts as a receptor for various other groups such as lactams and beta amino acids. PGA is also shown in Scheme 2:
Cleave a model substrate similar to penicillin G, eg, 6-nitro-3- (phenylacetamido) benzoic acid (NIPAB) of structural formula (IV) is converted to structural formula (III) Can also be characterized by the ability to cleave to phenylacetic acid and 5-amino-2-nitro-benzoic acid of structural formula (V) (eg Alkema et al., Anal. Biochem. 275: 47-53, [ 1999]). Since 5-amino-2-nitro-benzoic acid is chromogenic, the substrate of formula (IV) provides a convenient way to measure PGA activity. In addition to the reactions described above, PGA can also be used for kinetic degradation of DL-tert leucine to prepare optically pure tert leucine (see, eg, Liu et al., Prep. Biochem. Biotechnol. 36: 235-41, [2006]).

本開示のPGAは、生物Kluyvera citrophila(K.citrophila)から得られた酵素に基づく。他の生物由来のPGAと同様に、K.citrophilaのPGAは、プレ−プロ−PGAポリペプチドのタンパク質分解性プロセシングによって生じる、α−サブユニットおよびβ−サブユニットで構成されるヘテロ二量体酵素である。シグナルペプチドおよびスペーサーペプチドを除去することにより、成熟ヘテロ二量体が生成される(例えば、Barberoら、Gene、49巻:69〜80頁、[1986年]を参照のこと)。K.citrophilaの天然に存在するプレ−プロ−PGAポリペプチドのアミノ酸配列は公的に入手可能であり(例えば、GenBankアクセッション番号P07941、[gi:129551]を参照のこと)、本明細書において配列番号2として提示される。天然に存在するK citrophila PGAのα鎖配列は、配列番号2の残基27〜235に対応する。天然に存在するK citrophila PGAのβ鎖配列は、配列番号2の残基290〜846に対応する。配列番号2の残基1〜26はシグナルペプチドに対応し、配列番号2の残基236〜289は連結しているプロペプチドに対応し、その両方が除去されて、α鎖サブユニットおよびβ鎖サブユニットを含むヘテロ二量体である、天然に存在する成熟PGA酵素が生じる。   The PGA of the present disclosure is based on an enzyme obtained from the organism Kluyvera citrophila (K. citrophila). Similar to PGA from other organisms, K.I. Citrophila PGA is a heterodimeric enzyme composed of α-subunits and β-subunits generated by proteolytic processing of pre-pro-PGA polypeptides. Removal of the signal peptide and spacer peptide produces a mature heterodimer (see, eg, Barbero et al., Gene, 49: 69-80, [1986]). K. The amino acid sequence of the naturally occurring pre-pro-PGA polypeptide of citrophila is publicly available (see, eg, GenBank Accession No. P07794, [gi: 129551]), and herein SEQ ID NO: Presented as 2. The α chain sequence of the naturally occurring K 2 citrophila PGA corresponds to residues 27-235 of SEQ ID NO: 2. The naturally occurring β-chain sequence of K.sub.3 cytophila PGA corresponds to residues 290-846 of SEQ ID NO: 2. Residues 1-26 of SEQ ID NO: 2 correspond to the signal peptide, residues 236-289 of SEQ ID NO: 2 correspond to the linking propeptide, both of which are removed to form the α chain subunit and β chain A naturally occurring mature PGA enzyme is produced, which is a heterodimer containing subunits.

いくつかの実施形態では、本発明は、配列番号2、4、6、8、10および/または12に対して少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%またはそれを超える配列同一性を有するアミノ酸配列を有する操作されたPGAポリペプチドを提供する。   In some embodiments, the invention provides at least about 85%, 86%, 87%, 88%, 89%, 90%, 91 relative to SEQ ID NOs: 2, 4, 6, 8, 10, and / or 12. Engineered PGA polypeptides having amino acid sequences with%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% or greater sequence identity are provided.

本発明は、実験室規模の調製的使用に適したインスリン特異的脱アシル化生体触媒を提供する。定向進化法を使用して、インスリン上のA1/B1/B29−トリフェニル酢酸保護基を完全に除去し、>99%の遊離のインスリンを生成することができる効率的なアシラーゼ改変体を開発した。たった2ラウンドの進化後に、0.8g/Lの酵素負荷で6時間未満のうちに99%超の遊離のインスリンを生成する改変体が生じた。最終的な最良の改変体PGA_005は、最初の骨格に対して約8倍改善された。本明細書において提示されるPGA改変体は、広範囲のアシル基を受容することができ、野生型PGAと比較して増加した溶媒安定性、および改善された熱安定性(thermostability)を示す。本明細書において提示される改変体PGAはスペーサー領域を欠く。したがって、活性酵素を産生させるために自己プロセシングステップは必要ない。   The present invention provides insulin-specific deacylated biocatalysts suitable for laboratory scale preparative use. Using directed evolution, an efficient acylase variant has been developed that can completely remove the A1 / B1 / B29-triphenylacetic acid protecting group on insulin and produce> 99% free insulin. . After only 2 rounds of evolution, variants were produced that produced> 99% free insulin in less than 6 hours at an enzyme load of 0.8 g / L. The final best variant PGA_005 was improved about 8-fold over the original scaffold. The PGA variants presented herein can accept a wide range of acyl groups and exhibit increased solvent stability and improved thermostability compared to wild-type PGA. The variant PGA presented herein lacks a spacer region. Thus, no self-processing step is necessary to produce an active enzyme.

本発明は、操作されたPGAポリペプチドをコードするポリヌクレオチドも提供する。いくつかの実施形態では、遺伝子発現を制御する1つ以上の異種調節配列にポリヌクレオチドを作動可能に連結して、前記ポリペプチドを発現することができる組換えポリヌクレオチドを作製する。操作されたPGAポリペプチドをコードする異種ポリヌクレオチドを含有する発現構築物を適切な宿主細胞に導入して、対応するPGAポリペプチドを発現させることができる。   The invention also provides polynucleotides that encode engineered PGA polypeptides. In some embodiments, the polynucleotide is operably linked to one or more heterologous regulatory sequences that control gene expression to create a recombinant polynucleotide capable of expressing the polypeptide. An expression construct containing a heterologous polynucleotide encoding the engineered PGA polypeptide can be introduced into a suitable host cell to express the corresponding PGA polypeptide.

様々なアミノ酸に対応するコドンの知見に起因して、タンパク質配列の利用可能性により、対象をコードすることができるすべてのポリヌクレオチドの説明が提供される。同じアミノ酸が代替または同義のコドンによってコードされる遺伝子コードの縮重は、本明細書に開示されている改善されたPGA酵素をすべてがコードする極端に多数の核酸が作られることを可能にする。したがって、特定のアミノ酸配列を同定したら、当業者は、タンパク質のアミノ酸配列を変更しない方法で、1つ以上のコドンの配列を単に改変することによって、任意の数の様々な核酸を作ることができると予想される。この点において、本開示は、可能なコドン選択に基づく組み合わせを選択することによって作られ得るポリヌクレオチドのそれぞれのおよびすべての可能なバリエーションを特に意図し、すべてのこのようなバリエーションは、実施例5および6における表に示されているアミノ酸配列を含めて、本明細書に開示される任意のポリペプチドについて具体的に開示されるとみなされるべきである。   Due to the knowledge of codons corresponding to various amino acids, the availability of protein sequences provides an explanation of all the polynucleotides that can encode a subject. The degeneracy of the genetic code in which the same amino acids are encoded by alternative or synonymous codons allows an extremely large number of nucleic acids to be produced that all encode the improved PGA enzyme disclosed herein. . Thus, once a particular amino acid sequence has been identified, one skilled in the art can make any number of different nucleic acids by simply modifying the sequence of one or more codons in a way that does not alter the amino acid sequence of the protein. It is expected to be. In this regard, the present disclosure specifically contemplates each and every possible variation of a polynucleotide that can be made by selecting combinations based on possible codon choices, and all such variations are described in Example 5. And should be considered to be specifically disclosed for any of the polypeptides disclosed herein, including the amino acid sequences shown in the table in FIGS.

様々な実施形態では、コドンは、タンパク質が産生されている宿主細胞に合うように選択されることが好ましい。例えば、細菌中で使用される好ましいコドンは、細菌内での発現に使用され;酵母中で使用される好ましいコドンは、酵母内での発現に使用され、哺乳動物で使用される好ましいコドンは、哺乳動物細胞での発現に使用される。   In various embodiments, the codon is preferably selected to be compatible with the host cell in which the protein is produced. For example, preferred codons used in bacteria are used for expression in bacteria; preferred codons used in yeast are used for expression in yeast, and preferred codons used in mammals are: Used for expression in mammalian cells.

ある特定の実施形態では、天然の配列は好ましいコドンを含むため、および好ましいコドンの使用は、すべてのアミノ酸残基に必要とされない場合があるため、PGAポリペプチドのコドン使用頻度を最適化するのに、すべてのコドンが置換される必要はない。したがって、PGA酵素をコードする、コドンが最適化されたポリヌクレオチドは、全長コード領域の約40%、50%、60%、70%、80%、または90%超のコドン位置で好ましいコドンを含有し得る。   In certain embodiments, the codon usage of a PGA polypeptide is optimized because the native sequence includes preferred codons and because preferred codon usage may not be required for all amino acid residues. In addition, not all codons need to be replaced. Thus, codon optimized polynucleotides encoding PGA enzymes contain preferred codons at more than about 40%, 50%, 60%, 70%, 80%, or 90% codon positions of the full length coding region. Can do.

いくつかの実施形態では、ポリヌクレオチドは、本明細書に記載される参照操作されたPGAポリペプチドのいずれかのα鎖および/またはβ鎖に対して少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%またはそれを超える配列同一性を有するアミノ酸配列を有するPGAポリペプチドをコードするヌクレオチド配列を含む。したがって、いくつかの実施形態では、ポリヌクレオチドは、配列番号2に基づく参照α鎖配列およびβ鎖配列に対して少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれを超えて同一であるアミノ酸配列をコードする。いくつかの実施形態では、ポリヌクレオチドは、配列番号2のα鎖アミノ酸配列および/またはβ鎖アミノ酸配列をコードする。   In some embodiments, the polynucleotide is at least about 85%, 86%, 87%, relative to the α and / or β chain of any of the reference engineered PGA polypeptides described herein. PGA having an amino acid sequence with sequence identity of 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% or more It includes a nucleotide sequence that encodes a polypeptide. Thus, in some embodiments, the polynucleotide is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91 relative to the reference α and β chain sequences based on SEQ ID NO: 2. It encodes amino acid sequences that are%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more identical. In some embodiments, the polynucleotide encodes the α chain amino acid sequence and / or the β chain amino acid sequence of SEQ ID NO: 2.

いくつかの実施形態では、ポリヌクレオチドは、配列番号4、6、8、10、および/または12に対して少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%またはそれを超える配列同一性を有するアミノ酸配列を有するPGAポリペプチドをコードするヌクレオチド配列を含む。したがって、いくつかの実施形態では、ポリヌクレオチドは、配列番号1、3、5、7、9、および/または11に対して少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれを超えて同一であるアミノ酸配列をコードする。   In some embodiments, the polynucleotide is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91% relative to SEQ ID NOs: 4, 6, 8, 10, and / or 12. , 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% or more nucleotide sequence encoding a PGA polypeptide having an amino acid sequence with sequence identity. Thus, in some embodiments, the polynucleotide is at least about 85%, 86%, 87%, 88%, 89%, 90 relative to SEQ ID NO: 1, 3, 5, 7, 9, and / or 11. %, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more amino acid sequences that are identical are encoded.

いくつかの実施形態では、改善されたPGAポリペプチドをコードする単離されたポリヌクレオチドは、ポリペプチドの改善された活性および/または発現がもたらされるように様々な方法で操作されたものである。発現ベクターに応じて、単離されたポリヌクレオチドをベクターに挿入する前に操作することが望ましいかまたは必要であり得る。組換えDNA法を利用してポリヌクレオチドおよび核酸配列を改変するための技術は、当技術分野で周知である。   In some embodiments, an isolated polynucleotide encoding an improved PGA polypeptide has been engineered in various ways to provide improved activity and / or expression of the polypeptide. . Depending on the expression vector, it may be desirable or necessary to manipulate the isolated polynucleotide prior to insertion into the vector. Techniques for modifying polynucleotide and nucleic acid sequences utilizing recombinant DNA methods are well known in the art.

例えば、発現させること、スクリーニングすること、およびアッセイすることができる改変体ライブラリーを作製するために、変異誘発および定向進化法をポリヌクレオチドに容易に適用することができる。変異誘発および定向進化法は当技術分野で周知である(例えば、すべてが参照により本明細書に組み込まれる、米国特許第5,605,793号、同第5,830,721号、同第6,132,970号、同第6,420,175号、同第6,277,638号、同第6,365,408号、同第6,602,986号、同第7,288,375号、同第6,287,861号、同第6,297,053号、同第6,576,467号、同第6,444,468号、同第5,811238号、同第6,117,679号、同第6,165,793号、同第6,180,406号、同第6,291,242号、同第6,995,017号、同第6,395,547号、同第6,506,602号、同第6,519,065号、同第6,506,603号、同第6,413,774号、同第6,573,098号、同第6,323,030号、同第6,344,356号、同第6,372,497号、同第7,868,138号、同第5,834,252号、同第5,928,905号、同第6,489,146号、同第6,096,548号、同第6,387,702号、同第6,391,552号、同第6,358,742号、同第6,482,647号、同第6,335,160号、同第6,653,072号、同第6,355,484号、同第6,03,344号、同第6,319,713号、同第6,613,514号、同第6,455,253号、同第6,579,678号、同第6,586,182号、同第6,406,855号、同第6,946,296号、同第7,534,564号、同第7,776,598号、同第5,837,458号、同第6,391,640号、同第6,309,883号、同第7,105,297号、同第7,795,030号、同第6,326,204号、同第6,251,674号、同第6,716,631号、同第6,528,311号、同第6,287,862号、同第6,335,198号、同第6,352,859号、同第6,379,964号、同第7,148,054号、同第7,629,170号、同第7,620,500号、同第6,365,377号、同第6,358,740号、同第6,406,910号、同第6,413,745号、同第6,436,675号、同第6,961,664号、同第7,430,477号、同第7,873,499号、同第7,702,464号、同第7,783,428号、同第7,747,391号、同第7,747,393号、同第7,751,986号、同第6,376,246号、同第6,426,224号、同第6,423,542号、同第6,479,652号、同第6,319,714号、同第6,521,453号、同第6,368,861号、同第7,421,347号、同第7,058,515号、同第7,024,312号、同第7,620,502号、同第7,853,410号、同第7,957,912号、同第7,904,249号、およびすべての関連する米国以外の対応物;Lingら、Anal. Biochem.、254巻(2号):157〜78頁、[1997年];Daleら、Meth. Mol. Biol.、57巻:369〜74頁、[1996年];Smith、Ann. Rev. Genet.、19巻:423〜462頁、[1985年];Botsteinら、Science、229巻:1193〜1201頁、[1985年];Carter、Biochem. J.、237巻:1〜7頁、[1986年];Kramerら、Cell、38巻:879〜887頁、[1984年];Wellsら、Gene、34巻:315〜323頁、[1985年];Minshullら、Curr. Op. Chem. Biol.、3巻:284〜290頁、[1999年];Christiansら、Nat. Biotechnol.、17巻:259〜264頁、[1999年];Crameriら、Nature、391巻:288〜291頁、[1998年];Crameriら、Nat. Biotechnol.、15巻:436〜438頁、[1997年];Zhangら、Proc. Nat. Acad. Sci. U.S.A.、94巻:4504〜4509頁、[1997年];Crameriら、Nat. Biotechnol.、14巻:315〜319頁、[1996年];Stemmer、Nature、370巻:389〜391頁、[1994年];Stemmer、Proc. Nat. Acad. Sci. USA、91巻:10747〜10751頁、[1994年];WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767;およびWO2009/152336を参照のこと)。   For example, mutagenesis and directed evolution methods can be readily applied to polynucleotides to create variant libraries that can be expressed, screened, and assayed. Mutagenesis and directed evolution methods are well known in the art (eg, US Pat. Nos. 5,605,793, 5,830,721, 6th, all of which are incorporated herein by reference). 132,970, 6,420,175, 6,277,638, 6,365,408, 6,602,986, 7,288,375 No. 6,287,861, No. 6,297,053, No. 6,576,467, No. 6,444,468, No. 5,8111238, No. 6,117, No. 679, No. 6,165,793, No. 6,180,406, No. 6,291,242, No. 6,995,017, No. 6,395,547, No. 6,506,602, 6,519,065, 6,506 03, 6,413,774, 6,573,098, 6,323,030, 6,344,356, 6,372,497, 7,868,138, 5,834,252, 5,928,905, 6,489,146, 6,096,548, 6,387,702 No. 6,391,552, No. 6,358,742, No. 6,482,647, No. 6,335,160, No. 6,653,072, No. 6 No. 6,355,484, No. 6,03,344, No. 6,319,713, No. 6,613,514, No. 6,455,253, No. 6,579,678. 6,586,182, 6,406,855, 6,946,296, 7, No. 34,564, No. 7,776,598, No. 5,837,458, No. 6,391,640, No. 6,309,883, No. 7,105,297, 7,795,030, 6,326,204, 6,251,674, 6,716,631, 6,528,311, 6,287 , 862, 6,335,198, 6,352,859, 6,379,964, 7,148,054, 7,629,170, No. 7,620,500, No. 6,365,377, No. 6,358,740, No. 6,406,910, No. 6,413,745, No. 6,436, No. 675, No. 6,961,664, No. 7,430,477, No. 7,873,499, 7,702,464, 7,783,428, 7,747,391, 7,747,393, 7,751,986, 6,376 No. 246, No. 6,426,224, No. 6,423,542, No. 6,479,652, No. 6,319,714, No. 6,521,453, No. 6,521,453 No. 6,368,861, No. 7,421,347, No. 7,058,515, No. 7,024,312, No. 7,620,502, No. 7,853 410, 7,957,912, 7,904,249, and all related non-US counterparts; Ling et al., Anal. Biochem. 254 (2): 157-78 [1997]; Dale et al., Meth. Mol. Biol., 57: 369-74, [1996]; Smith. Ann. Rev. Genet., 19: 423-462, [1985]; Botstein et al., Science 229: 1193-1201, [1985]; Carter, Biochem. J., 237: 1 -7, [1986]; Kramer et al., Cell, 38: 879-887, [1984]; Wells et al., Gene, 34: 315-323, [1985]; Minshull et al., Curr. Op. Chem. Biol., 3: 284-290, [1999]; Christians et al., Nat. Biotechnol., 17: 259-264, [1999]; Crameri et al., Nature, 391: 288. 291, [1998]; Crameri et al., Nat. Biotechnol. 15: 436-438, [1997]; Zhang et al., Proc. Nat. Acad. Sci. USA, 94: 4504-4509. [1997]; Crameri et al., Nat. Biotechnol., 14: 315-319, [ 996]; Stemmer, Nature, 370: 389-391, [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91: 10747-10751, [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; and WO 2009/152336).

いくつかの実施形態では、本発明の改変体PGAアシラーゼは、コードされる酵素の活性を変化させないさらなる配列をさらに含む。例えば、いくつかの実施形態では、改変体PGAアシラーゼは、エピトープタグ、または精製において有用な別の配列に連結されている。   In some embodiments, a variant PGA acylase of the present invention further comprises additional sequences that do not alter the activity of the encoded enzyme. For example, in some embodiments, the variant PGA acylase is linked to an epitope tag, or another sequence useful in purification.

いくつかの実施形態では、本発明の改変体PGAアシラーゼポリペプチドは、それを発現する宿主細胞(例えば、酵母または糸状菌宿主細胞)から分泌され、シグナルペプチド(すなわち、ポリペプチドのアミノ末端に連結された、コードされるポリペプチドを細胞の分泌経路に向かわせるアミノ酸配列)を含むプレタンパク質として発現される。   In some embodiments, a variant PGA acylase polypeptide of the invention is secreted from a host cell that expresses it (eg, a yeast or filamentous fungal host cell) and linked to the signal peptide (ie, the amino terminus of the polypeptide). The encoded polypeptide is expressed as a preprotein comprising an amino acid sequence that directs the encoded polypeptide into the cell's secretory pathway.

いくつかの実施形態では、シグナルペプチドは、内在性K.citrophila PGAアシラーゼシグナルペプチドである。いくつかの他の実施形態では、他のK.citrophila分泌タンパク質由来のシグナルペプチドが使用される。いくつかの実施形態では、宿主細胞および他の因子に応じて、他のシグナルペプチドが使用される。糸状菌宿主細胞についての有効なシグナルペプチドコード領域としては、限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus niger中性アミラーゼ、Aspergillus nigerグルコアミラーゼ、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、Humicola insolensセルラーゼ、Humicola lanuginosaリパーゼ、およびT.reeseiセロビオヒドロラーゼIIから得られるシグナルペプチドコード領域が挙げられる。細菌宿主細胞のためのシグナルペプチドコード領域としては、限定されないが、Bacillus NClB11837マルトース生成アミラーゼ(maltogenic amylase)、Bacillus stearothermophilus α−アミラーゼ、Bacillus licheniformisサブチリシン、Bacillus licheniformis β−ラクタマーゼ、Bacillus stearothermophilus中性プロテアーゼ(nprT、nprS、nprM)、およびBacillus subtilis prsAの遺伝子から得られるシグナルペプチドコード領域が挙げられる。いくつかのさらなる実施形態では、他のシグナルペプチドが本発明において使用される(例えば、参照により本明細書に組み込まれる、SimonenおよびPalva、Microbiol. Rev.、57巻:109〜137頁、[1993年]を参照のこと)。酵母宿主細胞についてのさらなる有用なシグナルペプチドとしては、Saccharomyces cerevisiae α−因子、Saccharomyces cerevisiae SUC2インベルターゼの遺伝子に由来するものが挙げられる(例えば、TaussigおよびCarlson、Nucl. Acids Res.、11巻:1943〜54頁、[1983年];SwissProtアクセッション番号P00724;およびRomanosら、Yeast、8巻:423〜488頁、[1992年]を参照のこと)。いくつかの実施形態では、これらのシグナルペプチドの改変体および他のシグナルペプチドが使用される。実際に、当技術分野で公知の任意の適切なシグナルペプチドが本発明において使用されるので、本発明は、いかなる特定のシグナルペプチドにも限定されるものではない。   In some embodiments, the signal peptide is endogenous K. Citrophila PGA acylase signal peptide. In some other embodiments, other K.P. A signal peptide derived from a citrophila secreted protein is used. In some embodiments, other signal peptides are used depending on the host cell and other factors. Effective signal peptide coding regions for filamentous fungal host cells include, but are not limited to, Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miol heinol cellinol protease, T.A. and a signal peptide coding region obtained from reesei cellobiohydrolase II. Signal peptide coding regions for bacterial host cells include, but are not limited to, Bacillus NClB11837 maltogenic amylase, Bacillus stearothermophilus α-amylase, Bacillus licheniformis subtilisin, Bacillus licheniformis beta-lactiformase, , NprS, nprM), and the signal peptide coding region obtained from the genes of Bacillus subtilis prsA. In some further embodiments, other signal peptides are used in the present invention (eg, Simonen and Palva, Microbiol. Rev., 57: 109-137, [1993], incorporated herein by reference). Year)). Further useful signal peptides for yeast host cells include those derived from the genes for Saccharomyces cerevisiae α-factor, Saccharomyces cerevisiae SUC2 invertase (eg, Taussig and Carlson, Nucl. Acids Res., 11: 1943). 54, [1983]; SwissProt accession number P00724; and Romanos et al., Yeast, 8: 423-488, [1992]). In some embodiments, variants of these signal peptides and other signal peptides are used. Indeed, the present invention is not limited to any particular signal peptide, as any suitable signal peptide known in the art is used in the present invention.

いくつかの実施形態では、本発明は、本明細書に記載される改変体PGAアシラーゼポリペプチド、および/または生物学的に活性なその断片をコードするポリヌクレオチドを提供する。いくつかの実施形態では、遺伝子発現を制御する1つ以上の異種調節配列または制御配列にポリヌクレオチドを作動可能に連結して、ポリペプチドを発現することができる組換えポリヌクレオチドを作製する。いくつかの実施形態では、改変体PGAアシラーゼをコードする異種ポリヌクレオチドを含有する発現構築物を適切な宿主細胞に導入して、改変体PGAアシラーゼを発現させる。   In some embodiments, the present invention provides polynucleotides that encode the variant PGA acylase polypeptides described herein, and / or biologically active fragments thereof. In some embodiments, the polynucleotide is operably linked to one or more heterologous regulatory or control sequences that control gene expression to create a recombinant polynucleotide capable of expressing the polypeptide. In some embodiments, an expression construct containing a heterologous polynucleotide encoding a variant PGA acylase is introduced into a suitable host cell to express the variant PGA acylase.

遺伝子コードの縮重に起因して、本発明の改変体PGAアシラーゼポリペプチドをコードするヌクレオチド配列が多数存在することが当業者には理解される。例えば、コドンAGA、AGG、CGA、CGC、CGG、およびCGUはすべて、アミノ酸アルギニンをコードする。したがって、コドンによりアルギニンが指定される本発明の核酸内のすべての位置において、そのコドンを、コードされるポリペプチドを変化させることなく、上記の対応するコドンのいずれかに変更することができる。RNA配列内の「U」は、DNA配列内の「T」に対応することが理解される。本発明は、可能なコドン選択に基づいて組み合わせを選択することによって作られ得る本発明のポリペプチドをコードする核酸配列のそれぞれのおよびすべての可能なバリエーションを意図し、提供する。   It will be appreciated by those skilled in the art that due to the degeneracy of the genetic code, there are a large number of nucleotide sequences that encode the variant PGA acylase polypeptides of the invention. For example, the codons AGA, AGG, CGA, CGC, CGG, and CGU all encode the amino acid arginine. Thus, at every position in the nucleic acid of the invention where arginine is specified by a codon, the codon can be changed to any of the corresponding codons described above without altering the encoded polypeptide. It is understood that “U” in the RNA sequence corresponds to “T” in the DNA sequence. The present invention contemplates and provides each and every possible variation of a nucleic acid sequence encoding a polypeptide of the present invention that can be made by selecting combinations based on possible codon choices.

上に示されている通り、PGAをコードするDNA配列は、高コドン使用頻度バイアスのコドン(同じアミノ酸をコードする他のコドンより、タンパク質コード領域において高い頻度で使用されるコドン)について設計することもできる。好ましいコドンは、1個の遺伝子、共通の機能もしくは起源の一連の遺伝子、高度に発現された遺伝子におけるコドン使用頻度、生物全体の凝集タンパク質コード領域におけるコドン出現頻度、関連する生物の凝集タンパク質コード領域におけるコドン出現頻度、またはこれらの組み合わせに関して決定することができる。遺伝子発現レベルと共にその頻度が増加するコドンは一般に、発現にとっての最適なコドンである。特に、特定の宿主生物における発現のためにDNA配列を最適化することができる。多変量解析(例えば、クラスター分析または対応分析を使用する)を含む、特定の生物におけるコドン出現頻度(例えば、コドン使用頻度、相対的な同義コドン使用頻度)およびコドン優先度を決定するための様々な方法、ならびに遺伝子において使用されるコドンの有効数を決定するための様々な方法が当技術分野で周知である。コドン使用頻度を得るためのデータソースは、タンパク質をコードすることができる任意の入手可能なヌクレオチド配列に依拠することができる。これらのデータセットは、当技術分野で周知であるように、発現タンパク質をコードすることが実際に公知である核酸配列(例えば、完全なタンパク質コード配列−CDS)、発現配列タグ(EST)、またはゲノム配列の予測されるコード領域を含む。改変体PGAをコードするポリヌクレオチドは、当技術分野で公知の任意の適切な方法を使用して調製され得る。一般には、オリゴヌクレオチドを個々に合成し、次いで結合(例えば、酵素的ライゲーション法もしくは化学的ライゲーション法、またはポリメラーゼ媒介法によって)して、基本的に任意の所望の連続的な配列を形成する。いくつかの実施形態では、本発明のポリヌクレオチドは、限定されないが、自動化された合成法を含む当技術分野で公知の任意の適切な方法を使用した化学合成によって調製される。例えば、ホスホラミダイト法では、オリゴヌクレオチドを合成し(例えば、自動DNAシンセサイザーで)、精製し、アニーリングし、ライゲーションし、適切なベクターにクローニングする。いくつかの実施形態では、次いで、二本鎖DNA断片を、相補鎖を合成し、その鎖を一緒に適切な条件下でアニーリングすることによって、または、適切なプライマー配列を有するDNAポリメラーゼを使用して相補鎖を付加することによってのいずれかで得る。本発明において有用な方法を提供する多数の一般的な標準的なテキストが当業者に周知である。   As indicated above, the DNA sequence encoding PGA should be designed for codons with high codon usage bias (codons used more frequently in the protein coding region than other codons encoding the same amino acid). You can also. Preferred codons are one gene, a series of genes of common function or origin, codon usage in highly expressed genes, codon frequency in aggregated protein coding regions of the entire organism, aggregated protein coding regions of related organisms Can be determined with respect to the frequency of codon occurrence, or a combination thereof. Codons whose frequency increases with gene expression level are generally the optimal codons for expression. In particular, the DNA sequence can be optimized for expression in a particular host organism. Various to determine codon frequency (eg, codon usage, relative synonymous codon usage) and codon preference in a particular organism, including multivariate analysis (eg, using cluster analysis or correspondence analysis) As well as various methods for determining the effective number of codons used in a gene are well known in the art. A data source for obtaining codon usage can rely on any available nucleotide sequence that can encode a protein. These data sets are, as is well known in the art, nucleic acid sequences that are actually known to encode expressed proteins (eg, complete protein coding sequence-CDS), expressed sequence tags (EST), or Contains the predicted coding region of the genomic sequence. A polynucleotide encoding a variant PGA can be prepared using any suitable method known in the art. In general, oligonucleotides are synthesized individually and then combined (eg, by enzymatic or chemical ligation, or polymerase-mediated methods) to form essentially any desired contiguous sequence. In some embodiments, the polynucleotides of the invention are prepared by chemical synthesis using any suitable method known in the art, including but not limited to automated synthetic methods. For example, in the phosphoramidite method, oligonucleotides are synthesized (eg, with an automated DNA synthesizer), purified, annealed, ligated, and cloned into an appropriate vector. In some embodiments, double-stranded DNA fragments are then synthesized by synthesizing complementary strands and annealing the strands together under appropriate conditions, or using a DNA polymerase with an appropriate primer sequence. Or by adding a complementary strand. Many common standard texts that provide methods useful in the present invention are well known to those skilled in the art.

操作されたPGAは、天然に存在するPGAをコードするポリヌクレオチドを、上記の変異誘発および/または定向進化法に供することによって得られ得る。変異誘発は、ランダム変異誘発および部位特異的変異誘発を含む当技術分野で公知の技術のいずれかに従って実施され得る。定向進化法は、シャッフリングを含む、改善された改変体についてスクリーニングするための当技術分野で公知の技術のいずれかを用いて実施され得る。使用される他の定向進化法手順としては、限定されないが、スタッガードエクステンションプロセス(staggered extension process)(StEP)、インビトロ組換え、変異誘発PCR、カセット変異誘発、オーバーラップ伸長によるスプライシング(SOEing)、ProSAR(商標)定向進化法など、ならびに任意の他の適切な方法が挙げられる。   Engineered PGAs can be obtained by subjecting a polynucleotide encoding a naturally occurring PGA to the mutagenesis and / or directed evolution methods described above. Mutagenesis can be performed according to any of the techniques known in the art, including random mutagenesis and site-directed mutagenesis. Directed evolution methods can be performed using any of the techniques known in the art for screening for improved variants, including shuffling. Other directed evolution procedures used include, but are not limited to, staggered extension process (StEP), in vitro recombination, mutagenesis PCR, cassette mutagenesis, splicing by overlap extension (SOEing), These include ProSAR ™ directed evolution methods, as well as any other suitable method.

変異誘発処理に従って得られたクローンを、所望の改善された酵素特性を有する操作されたPGAについてスクリーニングする。発現ライブラリーからの酵素活性の測定は、生成物が形成される速度をモニタリングする標準的な生化学技術を使用して実施され得る。所望の改善された酵素特性が熱安定性である場合、酵素調製物を規定温度に供し、熱処理後に残存する酵素活性の量を測定した後に、酵素活性を測定し得る。次いで、PGAをコードするポリヌクレオチドを含有するクローンを単離し、配列決定してヌクレオチド配列の変化を同定し(存在する場合)、これを使用して酵素を宿主細胞で発現させる。   Clones obtained according to the mutagenesis treatment are screened for engineered PGA with the desired improved enzyme properties. Measurement of enzyme activity from the expression library can be performed using standard biochemical techniques to monitor the rate at which product is formed. If the desired improved enzyme property is thermostable, the enzyme activity can be measured after subjecting the enzyme preparation to a defined temperature and measuring the amount of enzyme activity remaining after heat treatment. A clone containing the polynucleotide encoding PGA is then isolated and sequenced to identify nucleotide sequence changes (if any), which are used to express the enzyme in host cells.

操作されたポリペプチドの配列が公知である場合、酵素をコードするポリヌクレオチドは、公知の合成方法に従って、標準的な固相法によって調製され得る。いくつかの実施形態では、約100塩基までの断片を、個々に合成し、次いで結合(例えば、酵素的ライゲーション法もしくは化学的ライゲーション法、またはポリメラーゼ媒介法によって)することによって、任意の所望の連続的な配列を形成し得る。例えば、本発明のポリヌクレオチドおよびオリゴヌクレオチドは、化学合成(一般には、自動化された合成法で実施されるので、例えば、Beaucageら、Tet. Lett.、22巻:1859〜69頁、[1981年]に記載されている古典的なホスホラミダイト法を、またはMatthesら、EMBO J.、3巻:801〜05頁、[1984年]に記載されている方法を使用する)によって調製され得る。ホスホラミダイト法によれば、オリゴヌクレオチドを、合成し(例えば、自動DNAシンセサイザーで)、精製し、アニーリングし、ライゲーションし、適切なベクターにクローニングする。さらに、基本的に任意の核酸が、様々な商業的供給源のいずれかから入手され得る(例えば、The Midland Certified Reagent Company、Midland、TX、The Great American Gene Company、Ramona、CA、ExpressGen Inc. Chicago、IL、Operon Technologies Inc.、Alameda、CA、および他の多く)。   Where the sequence of the engineered polypeptide is known, the polynucleotide encoding the enzyme can be prepared by standard solid phase methods according to known synthetic methods. In some embodiments, fragments of up to about 100 bases are synthesized individually and then ligated (eg, by enzymatic or chemical ligation, or polymerase-mediated methods) to form any desired sequence. A typical sequence can be formed. For example, the polynucleotides and oligonucleotides of the present invention are chemically synthesized (generally performed by automated synthetic methods, eg, Beaucage et al., Tet. Lett., 22: 1859-69, [1981 Or by using the method described in Matthes et al., EMBO J., 3: 801-05, [1984]). According to the phosphoramidite method, oligonucleotides are synthesized (eg, with an automated DNA synthesizer), purified, annealed, ligated and cloned into an appropriate vector. Furthermore, essentially any nucleic acid can be obtained from any of a variety of commercial sources (eg, The Midland Certified Reagent Company, Midland, TX, The Great American Gene Company, Ramona, CA, ExpressGenh Inc.). , IL, Operon Technologies Inc., Alameda, CA, and many others).

本発明は、本明細書に提示されるように、少なくとも1つの改変体PGAをコードする配列を含む組換え構築物も提供する。いくつかの実施形態では、本発明は、異種プロモーターに作動可能に連結された改変体PGAポリヌクレオチドを含む発現ベクターを提供する。いくつかの実施形態では、本発明の発現ベクターを使用して適切な宿主細胞を形質転換して、宿主細胞が改変体PGAタンパク質を発現するのを可能にする。真菌および他の生物におけるタンパク質の組換え発現のための方法は当技術分野で周知であり、いくつもの発現ベクターが利用可能であるかまたは常套的な方法を使用して構築することができる。いくつかの実施形態では、本発明の核酸構築物は、本発明の核酸配列が挿入された、例えばプラスミド、コスミド、ファージ、ウイルス、細菌人工染色体(BAC)、酵母人工染色体(YAC)などの、ベクターを含む。いくつかの実施形態では、改変体PGAポリペプチド(複数可)を発現させるために適した様々な発現ベクターのいずれか1つに本発明のポリヌクレオチドを組み込む。適切なベクターとしては、限定されないが、染色体DNA配列、非染色体DNA配列および合成DNA配列(例えば、SV40の誘導体)、ならびに細菌プラスミド、ファージDNA、バキュロウイルス、酵母プラスミド、プラスミドとファージDNAの組み合わせに由来するベクター、ワクシニア、アデノウイルス、鶏痘ウイルス、仮性狂犬病、アデノウイルス、アデノ随伴ウイルス、レトロウイルス、および多くの他のものなどのウイルスDNAが挙げられる。遺伝子材料を細胞に形質導入し、複製が望まれる場合には関連する宿主において複製可能かつ生存可能である、任意の適切なベクターが本発明において使用される。いくつかの実施形態では、構築物は、タンパク質をコードする配列に作動可能に連結された、限定されないがプロモーターを含む調節配列をさらに含む。多数の適切なベクターおよびプロモーターが当業者に公知である。実際に、いくつかの実施形態では、特定の宿主において高い発現のレベルを得るために、多くの場合、本発明の改変体PGAを異種プロモーターの制御下で発現させることが有用である。いくつかの実施形態では、当技術分野で公知の任意の適切な方法を使用して、プロモーター配列を改変体PGAコード配列の5’領域に作動可能に連結する。改変体PGAを発現させるために有用なプロモーターの例としては、限定されないが、真菌由来のプロモーターが挙げられる。いくつかの実施形態では、真菌株においてPGA遺伝子以外の遺伝子の発現を駆動するプロモーター配列が使用される。非限定的な例として、エンドグルカナーゼをコードする遺伝子由来の真菌プロモーターを使用することができる。いくつかの実施形態では、PGAが由来する真菌株以外の真菌株においてPGA遺伝子の発現を駆動するプロモーター配列が使用される。糸状菌宿主細胞において本発明のヌクレオチド構築物の転写を導くために有用な他の適切なプロモーターの例としては、限定されないが、Aspergillus oryzae TAKAアミラーゼ、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、Aspergillus niger中性α−アミラーゼ、Aspergillus niger酸安定性α−アミラーゼ、Aspergillus nigerまたはAspergillus awamoriグルコアミラーゼ(glaA)、Rhizomucor mieheiリパーゼ、Aspergillus oryzaeアルカリ性プロテアーゼ、Aspergillus oryzaeトリオースリン酸イソメラーゼ、Aspergillus nidulansアセトアミダーゼ、およびFusarium oxysporumトリプシン様プロテアーゼの遺伝子から得られるプロモーター(例えば、参照により本明細書に組み込まれるWO96/00787を参照のこと)、ならびにNA2−tpiプロモーター(Aspergillus niger中性α−アミラーゼの遺伝子由来のプロモーターとAspergillus oryzaeトリオースリン酸イソメラーゼの遺伝子由来のプロモーターのハイブリッド)、cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy、およびglaAなどのプロモーター(例えば、すべてが参照により本明細書に組み込まれる、Nunbergら、Mol. Cell Biol.、4巻:2306〜2315頁、[1984年];Boelら、EMBO J.、3巻:1581〜85頁、[1984年];および欧州特許出願第137280号を参照のこと)、ならびにその変異体プロモーター、短縮プロモーター、およびハイブリッドプロモーターが挙げられる。   The present invention also provides a recombinant construct comprising a sequence encoding at least one variant PGA, as presented herein. In some embodiments, the present invention provides an expression vector comprising a modified PGA polynucleotide operably linked to a heterologous promoter. In some embodiments, the expression vectors of the invention are used to transform a suitable host cell to allow the host cell to express the variant PGA protein. Methods for recombinant expression of proteins in fungi and other organisms are well known in the art and any number of expression vectors are available or can be constructed using routine methods. In some embodiments, the nucleic acid construct of the present invention is a vector, such as a plasmid, cosmid, phage, virus, bacterial artificial chromosome (BAC), yeast artificial chromosome (YAC), into which the nucleic acid sequence of the present invention is inserted. including. In some embodiments, the polynucleotides of the invention are incorporated into any one of a variety of expression vectors suitable for expressing the variant PGA polypeptide (s). Suitable vectors include, but are not limited to, chromosomal, non-chromosomal and synthetic DNA sequences (eg, derivatives of SV40), and bacterial plasmids, phage DNA, baculovirus, yeast plasmids, combinations of plasmid and phage DNA. Examples include viral DNA such as vectors derived from, vaccinia, adenovirus, fowlpox virus, pseudorabies, adenovirus, adeno-associated virus, retrovirus, and many others. Any suitable vector is used in the present invention that transduces the genetic material into the cell and is replicable and viable in the relevant host if replication is desired. In some embodiments, the construct further comprises a regulatory sequence, including but not limited to a promoter, operably linked to the protein coding sequence. Many suitable vectors and promoters are known to those skilled in the art. Indeed, in some embodiments, it is often useful to express a variant PGA of the invention under the control of a heterologous promoter in order to obtain a high level of expression in a particular host. In some embodiments, the promoter sequence is operably linked to the 5 'region of the variant PGA coding sequence using any suitable method known in the art. Examples of promoters useful for expressing the modified PGA include, but are not limited to, fungal promoters. In some embodiments, promoter sequences that drive expression of genes other than PGA genes in fungal strains are used. As a non-limiting example, a fungal promoter derived from a gene encoding endoglucanase can be used. In some embodiments, promoter sequences are used that drive expression of the PGA gene in fungal strains other than the fungal strain from which the PGA is derived. Examples of other suitable promoters useful for directing transcription of the nucleotide constructs of the present invention in filamentous fungal host cells include, but are not limited to, Aspergillus oryzae TAKA amylase, Rhizomucor miehei aspartic proteinase, Aspergillus niger neutral α-amylase , Aspergillus niger acid-stable α-amylase, Aspergillus niger or Aspergillus awamori glucoamylase (glaA), Rhizomucor miehhei lipase, Aspergillus oryzae alkaline spoilase, Aspergillus oryzae alkaline spoilase Promoters derived from the genes for acetamidase and Fusarium oxysporum trypsin-like protease (see, for example, WO 96/00787, incorporated herein by reference), as well as the NA2-tpi promoter (the gene for Aspergillus niger neutral α-amylase Promoters derived from the Aspergillus oryzae triose phosphate isomerase gene, promoters such as cbh1, cbh2, egl1, egl2, pepA, hfb1, hfb2, xyn1, amy, and glaA (for example, all herein by reference) Nunberg et al., Mol. Cell Biol. 4: 2306-2315 [1984]; Boel et al., EMBO J. Volume 3: 1581-85, pp, [1984]; and European see Patent Application No. 137,280), as well as variants thereof promoter, truncated promoter, and hybrid promoters thereof.

酵母宿主細胞では、有用なプロモーターとして、限定されないが、Saccharomyces cerevisiaeエノラーゼ(eno−1)、Saccharomyces cerevisiaeガラクトキナーゼ(gal1)、Saccharomyces cerevisiaeアルコールデヒドロゲナーゼ/グリセルアルデヒド−3−リン酸脱水素酵素(ADH2/GAP)、およびS.cerevisiae 3−ホスホグリセリン酸キナーゼの遺伝子由来のプロモーターが挙げられる。酵母宿主細胞に対して有用なさらなる有用なプロモーターは当技術分野で公知である(例えば、参照により本明細書に組み込まれる、Romanosら、Yeast、8巻:423〜488頁、[1992年]を参照のこと)。さらに、真菌におけるキチナーゼ産生に関連するプロモーターが本発明において使用される(例えば、その両方が参照により本明細書に組み込まれるBlaiseauおよびLafay、Gene、120243〜248頁、[1992年];ならびにLimonら、Curr. Genet.、28巻:478〜83頁、[1995年]を参照のこと)。   In yeast host cells, useful promoters include, but are not limited to, Saccharomyces cerevisiae enolase (eno-1), Saccharomyces cerevisiae galactokinase (gal1), Saccharomyces cerevisiae alcohol dehydrogenase 3-glyceraldehyde 2-H2 GAP), and S.P. cerevisiae 3-phosphoglycerate kinase gene-derived promoter. Additional useful promoters useful for yeast host cells are known in the art (see, eg, Romanos et al., Yeast, 8: 423-488, [1992], incorporated herein by reference. See In addition, promoters associated with chitinase production in fungi are used in the present invention (eg, Blaiseau and Lafay, Gene, 120243-248, [1992], both of which are incorporated herein by reference; and Limon et al. Curr. Genet., 28: 478-83, [1995]).

細菌宿主細胞に関しては、本開示の核酸構築物の転写を導くための適切なプロモーターとしては、限定されないが、大腸菌lacオペロン、大腸菌trpオペロン、バクテリオファージλ、Streptomyces coelicolorアガラーゼ(agarase)遺伝子(dagA)、Bacillus subtilisレバンスクラーゼ遺伝子(sacB)、Bacillus licheniformis α−アミラーゼ遺伝子(amyL)、Bacillus stearothermophilusマルトース生成アミラーゼ遺伝子(amyM)、Bacillus amyloliquefaciens α−アミラーゼ遺伝子(amyQ)、Bacillus licheniformisペニシリナーゼ遺伝子(penP)、Bacillus subtilis xylA遺伝子およびxylB遺伝子、ならびに原核生物のβ−ラクタマーゼ遺伝子から得られるプロモーター(例えば、Villa-Kamaroffら、Proc. Natl. Acad. Sci. USA、75巻:3727〜3731頁、[1978年]を参照のこと)、ならびにtacプロモーター(例えば、DeBoerら、Proc. Natl. Acad. Sci. USA、80巻:21〜25頁、[1983年]を参照のこと)が挙げられる。   For bacterial host cells, suitable promoters for directing transcription of the disclosed nucleic acid constructs include, but are not limited to, the E. coli lac operon, the E. coli trp operon, the bacteriophage λ, the Streptomyces coelicolor agarase gene (dagA), Bacillus subtilis levansucrase gene (sacB), Bacillus licheniformis α-amylase gene (amyL), Bacillus stearothermophilus maltose gene amylase gene (amyM), Bacillus amyliquamequylase promoters derived from the llus subtilis xylA and xylB genes and the prokaryotic β-lactamase gene (eg, Villa-Kamaroff et al., Proc. Natl. Acad. Sci. USA, 75: 3727-3731, [1978] As well as the tac promoter (see, for example, DeBoer et al., Proc. Natl. Acad. Sci. USA, 80: 21-25, [1983]).

いくつかの実施形態では、クローニングされた本発明の改変体PGAはまた、適切な転写ターミネーター配列(宿主細胞によって認識されて転写を終結させる配列)も有する。ターミネーター配列は、ポリペプチドをコードする核酸配列の3’末端に作動可能に連結される。選択される宿主細胞内で機能的である任意のターミネーターが本発明において使用される。糸状菌宿主細胞のための例示的な転写ターミネーターとしては、限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus nigerグルコアミラーゼ、Aspergillus nidulansアントラニル酸シンターゼ、Aspergillus niger α−グルコシダーゼ、およびFusarium oxysporumトリプシン様プロテアーゼの遺伝子から得られるものが挙げられる(参照により本明細書に組み込まれる米国特許第7,399,627号も参照のこと)。いくつかの実施形態では、酵母宿主細胞のための例示的なターミネーターとしては、Saccharomyces cerevisiaeエノラーゼ、Saccharomyces cerevisiaeチトクロムC(CYC1)、およびSaccharomyces cerevisiaeグリセルアルデヒド−3−リン酸脱水素酵素の遺伝子から得られるものが挙げられる。酵母宿主細胞のための他の有用なターミネーターは当業者に周知である(例えば、Romanosら、Yeast、8巻:423〜88頁、[1992年]を参照のこと)。   In some embodiments, a cloned variant PGA of the present invention also has an appropriate transcription terminator sequence (a sequence that is recognized by the host cell to terminate transcription). The terminator sequence is operably linked to the 3 'end of the nucleic acid sequence encoding the polypeptide. Any terminator that is functional in the selected host cell is used in the present invention. Exemplary transcription terminators for filamentous fungal host cells include, but are not limited to, Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Aspergillus niger alpha-glucosidase, (See also US Pat. No. 7,399,627, incorporated herein by reference). In some embodiments, exemplary terminators for yeast host cells include Saccharomyces cerevisiae enolase, Saccharomyces cerevisiae cytochrome C (CYC1), and Saccharomyces cerevisiae glyceraldehyde-3-phosphate dehydrogenase-3-phosphate dehydrogenase Can be mentioned. Other useful terminators for yeast host cells are well known to those of skill in the art (see, eg, Romanos et al., Yeast, 8: 423-88, [1992]).

いくつかの実施形態では、クローニングされた改変体PGA配列の一部は、適切なリーダー配列(宿主細胞による翻訳に重要なmRNAの非翻訳領域)である。リーダー配列は、ポリペプチドをコードする核酸配列の5’末端に作動可能に連結される。選択される宿主細胞内で機能的である任意のリーダー配列が本発明において使用される。糸状菌宿主細胞のための例示的なリーダーとしては、限定されないが、Aspergillus oryzae TAKAアミラーゼおよびAspergillus nidulansトリオースリン酸イソメラーゼの遺伝子から得られるものが挙げられる。酵母宿主細胞のための適切なリーダーとしては、限定されないが、Saccharomyces cerevisiaeエノラーゼ(ENO−1)、Saccharomyces cerevisiae 3−ホスホグリセリン酸キナーゼ、Saccharomyces cerevisiae α−因子、およびSaccharomyces cerevisiaeアルコールデヒドロゲナーゼ/グリセルアルデヒド−3−リン酸脱水素酵素(ADH2/GAP)の遺伝子から得られるものが挙げられる。   In some embodiments, the portion of the cloned variant PGA sequence is an appropriate leader sequence (an untranslated region of the mRNA important for translation by the host cell). The leader sequence is operably linked to the 5 'end of the nucleic acid sequence encoding the polypeptide. Any leader sequence that is functional in the selected host cell is used in the present invention. Exemplary leaders for filamentous fungal host cells include, but are not limited to, those obtained from the genes for Aspergillus oryzae TAKA amylase and Aspergillus nidulans triose phosphate isomerase. Suitable leaders for yeast host cells include, but are not limited to, Saccharomyces cerevisiae enolase (ENO-1), Saccharomyces cerevisiae 3-phosphoglycerate kinase, Saccharomyces cerevisiae alpha-factor, and Saccharomyces cerevisiae aldehyde Examples thereof include those obtained from the gene for 3-phosphate dehydrogenase (ADH2 / GAP).

いくつかの実施形態では、本発明の配列は、ポリアデニル化配列(核酸配列の3’末端に作動可能に連結される配列であって、ポリアデノシン残基を転写されたmRNAに付加するシグナルとして転写時に宿主細胞によって認識される配列)も含む。選択される宿主細胞内で機能的である任意のポリアデニル化配列が本発明において使用される。糸状菌宿主細胞のための例示的なポリアデニル化配列としては、限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus nigerグルコアミラーゼ、Aspergillus nidulansアントラニル酸シンターゼ、Fusarium oxysporumトリプシン様プロテアーゼ、およびAspergillus niger α−グルコシダーゼの遺伝子から得られるものが挙げられる。酵母宿主細胞のための有用なポリアデニル化配列は、当技術分野で公知である(例えば、GuoおよびSherman、Mol. Cell. Biol.、l5巻:5983〜5990頁、[1995年]を参照のこと)。   In some embodiments, a sequence of the invention is a polyadenylation sequence (a sequence operably linked to the 3 ′ end of a nucleic acid sequence, which is transcribed as a signal that adds a polyadenosine residue to the transcribed mRNA. Sequences that are sometimes recognized by host cells). Any polyadenylation sequence that is functional in the selected host cell is used in the present invention. Exemplary polyadenylation sequences for filamentous fungal host cells include, but are not limited to, Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Fusarium oxysporum trypsin-like glycosylase, Can be obtained. Useful polyadenylation sequences for yeast host cells are known in the art (see, eg, Guo and Sherman, Mol. Cell. Biol., 15: 5983-5990, [1995]. ).

いくつかの実施形態では、制御配列は、ポリペプチドのアミノ末端に連結されたアミノ酸配列をコードするシグナルペプチドコード領域を含み、コードされるポリペプチドを細胞の分泌経路に向かわせる。核酸配列のコード配列の5’末端は、分泌されるポリペプチドをコードするコード領域のセグメントと、翻訳読み枠内で天然で連結されているシグナルペプチドコード領域を固有に含有し得る。あるいは、コード配列の5’末端は、このコード配列にとって外来であるシグナルペプチドコード領域を含有し得る。外来のシグナルペプチドコード領域は、コード配列がシグナルペプチドコード領域を天然に含有しない場合に必要になり得る。   In some embodiments, the control sequence includes a signal peptide coding region that encodes an amino acid sequence linked to the amino terminus of a polypeptide, directing the encoded polypeptide into the cell's secretory pathway. The 5 'end of the coding sequence of the nucleic acid sequence may inherently contain a segment of the coding region that encodes the secreted polypeptide and a signal peptide coding region that is naturally linked within the translation reading frame. Alternatively, the 5 'end of the coding sequence may contain a signal peptide coding region that is foreign to the coding sequence. A foreign signal peptide coding region may be required if the coding sequence does not naturally contain a signal peptide coding region.

あるいは、ポリペプチドの分泌を増強するために、外来のシグナルペプチドコード領域で天然のシグナルペプチドコード領域を単に置き換えることができる。しかし、選択される宿主細胞の分泌経路に発現したポリペプチドを誘導する任意のシグナルペプチドコード領域を本発明において使用することができる。   Alternatively, the native signal peptide coding region can simply be replaced with an exogenous signal peptide coding region to enhance polypeptide secretion. However, any signal peptide coding region that induces a polypeptide expressed in the secretory pathway of the selected host cell can be used in the present invention.

細菌宿主細胞のための有効なシグナルペプチドコード領域としては、限定されないが、Bacillus NClB11837マルトース生成アミラーゼ、Bacillus stearothermophilus α−アミラーゼ、Bacillus licheniformisサブチリシン、Bacillus licheniformis β−ラクタマーゼ、Bacillus stearothermophilus中性プロテアーゼ(nprT、nprS、nprM)、およびBacillus subtilis prsAの遺伝子から得られるシグナルペプチドコード領域が挙げられる。さらなるシグナルペプチドは、当技術分野で公知である(例えば、SimonenおよびPalva、Microbiol. Rev.、57巻:109〜137頁、[1993年]を参照のこと)。   Effective signal peptide coding regions for bacterial host cells include, but are not limited to, Bacillus NClB11837 maltogenic amylase, Bacillus stearothermophilus α-amylase, Bacillus licheniformis subtilisin, Bacillus licheniformis beta-lactamase β-lactamase, , NprM), and the signal peptide coding region obtained from the gene of Bacillus subtilis prsA. Additional signal peptides are known in the art (see, for example, Simonen and Palva, Microbiol. Rev., 57: 109-137, [1993]).

糸状菌宿主細胞についての有効なシグナルペプチドコード領域としては、限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus niger中性アミラーゼ、Aspergillus nigerグルコアミラーゼ、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、Humicola insolensセルラーゼ、およびHumicola lanuginosaリパーゼの遺伝子から得られるシグナルペプチドコード領域が挙げられる。   Effective signal peptide coding regions for filamentous fungal host cells include, but are not limited to, Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miol heinol cellinol hyalinol cellinol cellulin proserum H An example is a signal peptide coding region obtained from a gene.

酵母宿主細胞のための有用なシグナルペプチドとしては、限定されないが、Saccharomyces cerevisiae α−因子およびSaccharomyces cerevisiaeインベルターゼの遺伝子が挙げられる。他の有用なシグナルペプチドコード領域は、当技術分野で公知である(例えば、Romanosら、[1992年]、上記を参照のこと)。   Useful signal peptides for yeast host cells include, but are not limited to, the genes for Saccharomyces cerevisiae α-factor and Saccharomyces cerevisiae invertase. Other useful signal peptide coding regions are known in the art (see, eg, Romanos et al. [1992], supra).

いくつかの実施形態では、制御配列は、ポリペプチドのアミノ末端に位置するアミノ酸配列をコードするプロペプチドコード領域を含む。得られるポリペプチドは、プロ酵素またはプロポリペプチド(または一部の場合では、チモーゲン)として公知である。プロポリペプチドは、一般に不活性であり、プロポリペプチドからのプロペプチドの触媒的切断または自己触媒的切断によって、成熟活性PGAポリペプチドに変換することができる。プロペプチドコード領域は、Bacillus subtilisアルカリ性プロテアーゼ(aprE)、Bacillus subtilis中性プロテアーゼ(nprT)、Saccharomyces cerevisiae α−因子、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、およびMyceliophthora thermophilaラクターゼの遺伝子から得られ得る(例えば、WO95/33836を参照のこと)。   In some embodiments, the control sequence includes a propeptide coding region that codes for an amino acid sequence positioned at the amino terminus of a polypeptide. The resulting polypeptide is known as a proenzyme or propolypeptide (or zymogen in some cases). Propolypeptides are generally inactive and can be converted to mature active PGA polypeptides by catalytic or autocatalytic cleavage of the propeptide from the propolypeptide. The propeptide coding region is derived from Bacillus subtilis alkaline protease (aprE), Bacillus subtilis neutral protease (nprT), Saccharomyces cerevisiae α-factor, Rhizomucor miehei aspartic acid proteinase 33836).

シグナルペプチドおよびプロペプチド領域の両方がポリペプチドのアミノ末端に存在する場合、プロペプチド領域は、ポリペプチドのアミノ末端の隣に位置され、シグナルペプチド領域は、プロペプチド領域のアミノ末端の隣に位置される。   When both the signal peptide and the propeptide region are present at the amino terminus of the polypeptide, the propeptide region is located next to the amino terminus of the polypeptide and the signal peptide region is located next to the amino terminus of the propeptide region. Is done.

いくつかの実施形態では、宿主細胞の成長に関連して、ポリペプチドの発現の調節を可能にする調節配列も使用される。調節系の例は、調節化合物の存在を含む化学的または物理的な刺激に応答して、遺伝子の発現をオンオフさせるものである。原核生物宿主細胞では、適切な調節配列としては、限定されないが、lac、tac、およびtrpオペレーターシステムが挙げられる。酵母宿主細胞では、適切な調節系としては、例として、ADH2システムまたはGAL1システムが挙げられる。糸状菌では、適切な調節配列としては、TAKA α−アミラーゼプロモーター、Aspergillus nigerグルコアミラーゼプロモーター、およびAspergillus oryzaeグルコアミラーゼプロモーターが挙げられる。   In some embodiments, regulatory sequences are also used that allow for regulation of polypeptide expression in relation to the growth of the host cell. Examples of regulatory systems are those that turn gene expression on and off in response to chemical or physical stimuli, including the presence of regulatory compounds. In prokaryotic host cells, suitable regulatory sequences include, but are not limited to, the lac, tac, and trp operator systems. In yeast host cells, suitable regulatory systems include, by way of example, the ADH2 system or the GAL1 system. In filamentous fungi, suitable regulatory sequences include the TAKA alpha-amylase promoter, Aspergillus niger glucoamylase promoter, and Aspergillus oryzae glucoamylase promoter.

調節配列の他の例は、遺伝子増幅を可能にするものである。真核生物の系では、これらとして、メトトレキサートの存在下で増幅されるジヒドロ葉酸レダクターゼ遺伝子、および重金属で増幅されるメタロチオネイン遺伝子が挙げられる。これらの場合では、本発明のPGAポリペプチドをコードする核酸配列が調節配列に作動可能に連結される。   Other examples of regulatory sequences are those that allow gene amplification. In eukaryotic systems, these include the dihydrofolate reductase gene amplified in the presence of methotrexate and the metallothionein gene amplified with heavy metals. In these cases, the nucleic acid sequence encoding the PGA polypeptide of the present invention is operably linked to regulatory sequences.

したがって、さらなる実施形態では、本発明は、操作されたPGAポリペプチドまたはその改変体をコードするポリヌクレオチドと、プロモーターおよびターミネーターなどの1つ以上の発現調節領域と、複製起点などとを、これらが導入される宿主の種類に応じて含む組換え発現ベクターを提供する。いくつかの実施形態では、上記の様々な核酸および制御配列を一緒に結合させて、1つ以上の便利な制限部位(これは、このような部位において、ポリペプチドをコードする核酸配列の挿入または置換を可能にする)を含み得る組換え発現ベクターを生産し得る。あるいは、いくつかの実施形態では、核酸配列は、該核酸配列、またはその配列を含む核酸構築物を、発現のための適切なベクターに挿入することによって発現させる。発現ベクターの作製では、コード配列は、コード配列が発現のための適切な制御配列と作動可能に連結されるように、ベクター中に配置される。   Accordingly, in a further embodiment, the present invention provides a polynucleotide encoding an engineered PGA polypeptide or variant thereof, one or more expression control regions such as a promoter and terminator, an origin of replication, and the like. Recombinant expression vectors are provided according to the type of host to be introduced. In some embodiments, the various nucleic acids and control sequences described above are linked together to form one or more convenient restriction sites (such as insertion of a nucleic acid sequence encoding a polypeptide or Recombinant expression vectors can be produced that can contain substitutions). Alternatively, in some embodiments, the nucleic acid sequence is expressed by inserting the nucleic acid sequence, or a nucleic acid construct comprising the sequence, into an appropriate vector for expression. In creating the expression vector, the coding sequence is placed in the vector so that the coding sequence is operably linked with the appropriate control sequences for expression.

組換え発現ベクターは、組換えDNA手順に簡便に供することができ、そして、ポリヌクレオチド配列の発現をもたらし得る任意の適切なベクター(例えば、プラスミドまたはウイルス)を含む。ベクターの選択は、ベクターが導入される宿主細胞とのベクターの適合性に一般に依存する。いくつかの実施形態では、ベクターは、直鎖プラスミドまたは閉環状プラスミドである。   Recombinant expression vectors include any suitable vector (eg, a plasmid or virus) that can be conveniently subjected to recombinant DNA procedures and can result in expression of a polynucleotide sequence. The choice of vector generally depends on the compatibility of the vector with the host cell into which it is introduced. In some embodiments, the vector is a linear plasmid or a closed circular plasmid.

いくつかの実施形態では、発現ベクターは自律複製ベクター(すなわち、染色体外の実体として存在し、その複製が染色体複製とは独立しているベクター、例えばプラスミド、染色体外因子、ミニ染色体、または人工染色体)である。いくつかの実施形態では、ベクターは、自己複製を保証するための何らかの手段を含有する。あるいは、いくつかの他の実施形態では、ベクターは、宿主細胞中に導入されるとゲノムに組み込まれて、これが組み込まれた染色体と一緒に複製される。さらに、さらなる実施形態では、宿主細胞のゲノム中、またはトランスポゾン中に導入される全DNAを一緒に含有する1つのベクターもしくはプラスミドまたは2つもしくはそれを超えるベクターもしくはプラスミドが使用される。   In some embodiments, the expression vector is an autonomously replicating vector (ie, a vector that exists as an extrachromosomal entity and whose replication is independent of chromosomal replication, such as a plasmid, extrachromosomal factor, minichromosome, or artificial chromosome. ). In some embodiments, the vector contains some means for assuring self-replication. Alternatively, in some other embodiments, the vector is integrated into the genome when introduced into a host cell and replicated along with the chromosome into which it was integrated. Furthermore, in a further embodiment, one vector or plasmid or two or more vectors or plasmids are used which together contain the total DNA introduced into the genome of the host cell or into the transposon.

いくつかの実施形態では、本発明の発現ベクターは、形質転換細胞の容易な選択を可能にする1つ以上の選択マーカーを含有する。「選択マーカー」は、その産物が殺生物剤耐性またはウイルス耐性、抗菌薬または重金属に対する耐性、栄養要求体への原栄養性などを与える遺伝子である。限定されないが、amdS(アセトアミダーゼ)、argB(オルニチンカルバモイルトランスフェラーゼ)、bar(ホスフィノトリシンアセチルトランスフェラーゼ)、hph(ハイグロマイシンホスホトランスフェラーゼ)、niaD(硝酸還元酵素)、pyrG(オロチジン−5’−リン酸脱炭酸酵素)、sC(硫酸アデニルトランスフェラーゼ)、およびtrpC(アントラニル酸シンターゼ)、ならびにこれらの等価物を含む、糸状菌宿主細胞において使用するための任意の適切な選択マーカーが本発明において使用される。Aspergillusなどの宿主細胞において有用なさらなるマーカーとしては、限定されないが、Aspergillus nidulansまたはAspergillus oryzaeのamdS遺伝子およびpyrG遺伝子、ならびにStreptomyces hygroscopicusのbar遺伝子が挙げられる。酵母宿主細胞のための適切なマーカーとしては、限定されないが、ADE2、HIS3、LEU2、LYS2、MET3、TRP1、およびURA3が挙げられる。細菌選択マーカーの例としては、限定されないが、Bacillus subtilisもしくはBacillus licheniformis由来のdal遺伝子、または、アンピシリン、カナマイシン、クロラムフェニコール、およびまたはテトラサイクリン耐性などの抗生物質耐性を付与するマーカーが挙げられる。   In some embodiments, the expression vectors of the invention contain one or more selectable markers that allow easy selection of transformed cells. A “selectable marker” is a gene whose product confers biocide resistance or virus resistance, resistance to antibacterial drugs or heavy metals, prototrophy to auxotrophs, and the like. Without limitation, amdS (acetamidase), argB (ornithine carbamoyltransferase), bar (phosphinothricin acetyltransferase), hph (hygromycin phosphotransferase), niaD (nitrate reductase), pyrG (orotidine-5'-phosphate) Any suitable selectable marker for use in filamentous fungal host cells is used in the present invention, including decarboxylase), sC (sulfate adenyl transferase), and trpC (anthranilate synthase), and equivalents thereof. . Additional markers useful in host cells such as Aspergillus include, but are not limited to, the Aspergillus nidulans or Aspergillus oryzae amdS and pyrG genes, and the Streptomyces hygroscopicus bar gene. Suitable markers for yeast host cells include, but are not limited to, ADE2, HIS3, LEU2, LYS2, MET3, TRP1, and URA3. Examples of bacterial selectable markers include, but are not limited to, a dal gene from Bacillus subtilis or Bacillus licheniformis, or a marker that confers antibiotic resistance such as ampicillin, kanamycin, chloramphenicol, and / or tetracycline resistance.

いくつかの実施形態では、本発明の発現ベクターは、宿主細胞のゲノム中へのベクターの組み込みまたは細胞における、ゲノムとは独立したベクターの自律複製を可能にするエレメント(複数可)を含有する。宿主細胞のゲノム中への組み込みを伴ういくつかの実施形態では、ベクターは、ポリペプチドをコードする核酸配列、または、相同組換えもしくは非相同組換えによってゲノム中にベクターを組み込むためのベクターの任意の他のエレメントに依拠する。   In some embodiments, the expression vectors of the invention contain element (s) that allow integration of the vector into the genome of the host cell or autonomous replication of the vector in the cell independent of the genome. In some embodiments involving integration into the genome of a host cell, the vector is a nucleic acid sequence that encodes a polypeptide, or any of the vectors for integrating the vector into the genome by homologous or non-homologous recombination. Rely on other elements.

いくつかの代替的な実施形態では、発現ベクターは、宿主細胞のゲノム中への相同組換えによる組み込みを導くさらなる核酸配列を含有する。さらなる核酸配列は、ベクターが、宿主細胞のゲノム中に、染色体(複数可)の正確な位置(複数可)に組み込まれることを可能にする。正確な位置に組み込まれる可能性を増大させるために、組み込みエレメントは、相同組換えの確率を増強するために対応する標的配列と高度に相同なヌクレオチドを、好ましくは、100〜10,000塩基対、好ましくは400〜10,000塩基対、および最も好ましくは800〜10,000塩基対などの十分な数で含有する。組み込みエレメントは、宿主細胞のゲノム中の標的配列と相同な任意の配列であり得る。さらに、組み込みエレメントは、非コード核酸配列またはコード核酸配列であり得る。他方では、ベクターは、非相同組換えによって宿主細胞のゲノムに組み込まれ得る。   In some alternative embodiments, the expression vector contains additional nucleic acid sequences that direct integration by homologous recombination into the genome of the host cell. The additional nucleic acid sequence allows the vector to be integrated into the genome of the host cell at the exact location (s) of the chromosome (s). In order to increase the likelihood of integration in the correct position, the integration element will contain nucleotides that are highly homologous to the corresponding target sequence to enhance the probability of homologous recombination, preferably 100-10,000 base pairs. , Preferably 400-10,000 base pairs, and most preferably 800-10,000 base pairs. The integration element can be any sequence homologous to the target sequence in the genome of the host cell. Furthermore, the integration element can be a non-coding nucleic acid sequence or a coding nucleic acid sequence. On the other hand, the vector can be integrated into the genome of the host cell by non-homologous recombination.

自律複製のために、ベクターは、ベクターが問題の宿主細胞において自律的に複製することを可能にする複製起点をさらに含み得る。細菌複製起点の例は、P15A oriまたはプラスミドpBR322、pUC19、pACYCl77の複製起点(P15A oriを有するプラスミド)、または大腸菌における複製を可能にするpACYC184、およびBacillusにおける複製を可能にするpUB110、pE194、pTA1060、もしくはpAMβ1である。酵母宿主細胞において使用するための複製起点の例は、2ミクロン複製起点、ARS1、ARS4、ARS1とCEN3の組み合わせ、およびARS4とCEN6の組み合わせである。複製起点は、宿主細胞において機能性温度感受性にする変異を有するものであり得る(例えば、Ehrlich、Proc. Natl. Acad. Sci. USA、75巻:1433頁、[1978年]を参照のこと)。   For autonomous replication, the vector may further include an origin of replication that allows the vector to replicate autonomously in the host cell in question. Examples of bacterial origins of replication are the origin of replication of P15A ori or plasmids pBR322, pUC19, pACYCl77 (plasmid with P15A ori), or pACYC184 that allows replication in E. coli, and pUB110, pE194, pTA1060 that allow replication in Bacillus. Or pAMβ1. Examples of origins of replication for use in yeast host cells are 2 micron origins of replication, ARS1, ARS4, ARS1 and CEN3 combinations, and ARS4 and CEN6 combinations. The origin of replication can have a mutation that renders it functional temperature sensitive in the host cell (see, eg, Ehrlich, Proc. Natl. Acad. Sci. USA, 75: 1433, [1978]). .

いくつかの実施形態では、遺伝子産物の産生を増加させるために、本発明の核酸配列の1つ超のコピーを宿主細胞に挿入する。核酸配列のコピー数の増加は、配列のさらなるコピーを少なくとも1つ、宿主細胞のゲノム中に組み込むことによって得られ得る、または、増幅可能な選択マーカー遺伝子を核酸配列と共に含めることによって得られ得、この場合、細胞を適切な選択可能な薬剤の存在下で培養することにより、選択マーカー遺伝子の増幅されたコピー、およびそれにより、核酸配列のさらなるコピーを含有する細胞を選択することができる。   In some embodiments, more than one copy of the nucleic acid sequence of the invention is inserted into the host cell to increase production of the gene product. An increase in the copy number of the nucleic acid sequence can be obtained by integrating at least one additional copy of the sequence into the genome of the host cell, or by including an amplifiable selectable marker gene with the nucleic acid sequence, In this case, by culturing the cells in the presence of an appropriate selectable agent, one can select cells that contain an amplified copy of the selectable marker gene and thereby a further copy of the nucleic acid sequence.

本発明において使用するための発現ベクターが多数市販されている。適切な市販の発現ベクターとしては、限定されないが、CMVプロモーターと、哺乳動物宿主細胞における発現のためのhGHポリアデニル化部位と、pBR322複製起点と、大腸菌における増幅のためのアンピシリン耐性マーカーとを含む、p3xFLAGTM(商標)発現ベクター(Sigma−Aldrich Chemicals)が挙げられる。他の適切な発現ベクターとしては、限定されないが、pBluescriptII SK(−)およびpBK−CMV(Stratagene)、ならびにpBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)またはpPolyに由来するプラスミドが挙げられる(例えば、Latheら、Gene、57巻:193〜201頁、[1987年]を参照のこと)。   Many expression vectors are commercially available for use in the present invention. Suitable commercially available expression vectors include, but are not limited to, a CMV promoter, an hGH polyadenylation site for expression in mammalian host cells, a pBR322 origin of replication, and an ampicillin resistance marker for amplification in E. coli. p3xFLAGTM ™ expression vector (Sigma-Aldrich Chemicals). Other suitable expression vectors include, but are not limited to, pBluescriptII SK (-) and pBK-CMV (Stratagene), and pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) or P Plasmids (see, for example, Lathe et al., Gene, 57: 193-201, [1987]).

したがって、いくつかの実施形態では、ベクターの増殖および改変体PGA(複数可)の発現を可能にするために、少なくとも1つの改変体PGAをコードする配列を含むベクターを宿主細胞に形質転換する。いくつかの実施形態では、改変体PGAを翻訳後に改変して、シグナルペプチドを除去し、一部の場合では、分泌後に切断することができる。いくつかの実施形態では、上記の形質転換された宿主細胞を、改変体PGA(複数可)の発現を可能にする条件下、適切な栄養培地で培養する。限定されないが、適切な補充物質を含有する最小培地または複合培地を含む、宿主細胞を培養するために有用な任意の適切な培地が本発明において使用される。いくつかの実施形態では、宿主細胞をHTP培地中で成長させる。適切な培地は、様々な商業的な供給者から入手可能である、または、公開されたレシピ(例えば、American Type Culture Collectionのカタログ中)に従って調製され得る。   Thus, in some embodiments, a vector comprising a sequence encoding at least one variant PGA is transformed into a host cell to allow for propagation of the vector and expression of the variant PGA (s). In some embodiments, the variant PGA can be post-translationally modified to remove the signal peptide and, in some cases, cleaved after secretion. In some embodiments, the transformed host cell is cultured in a suitable nutrient medium under conditions that allow expression of the variant PGA (s). Any suitable medium useful for culturing host cells is used in the present invention, including, but not limited to, minimal medium or complex medium containing appropriate supplements. In some embodiments, host cells are grown in HTP medium. Suitable media are available from a variety of commercial suppliers or can be prepared according to published recipes (eg, in the catalog of the American Type Culture Collection).

別の態様では、本発明は、本明細書において提示される改善されたPGAポリペプチドをコードするポリヌクレオチドであって、宿主細胞においてPGA酵素を発現させるための1つ以上の制御配列に作動可能に連結されたポリヌクレオチドを含む宿主細胞を提供する。本発明の発現ベクターによってコードされるPGAポリペプチドの発現に使用される宿主細胞は当技術分野で周知であり、限定されないが、細菌細胞、例えば、大腸菌細胞、Bacillus megaterium細胞、Lactobacillus kefir細胞、Streptomyces細胞およびSalmonella typhimurium細胞;真菌細胞、例えば、酵母細胞(例えば、Saccharomyces cerevisiaeまたはPichia pastoris(ATCCアクセッション番号201178));昆虫細胞、例えば、Drosophila S2細胞およびSpodoptera Sf9細胞;動物細胞、例えば、CHO細胞、COS細胞、BHK細胞、293細胞、およびBowes黒色腫細胞;ならびに植物細胞が挙げられる。上記の宿主細胞に適切な培養培地および成長条件は、当技術分野で周知である。   In another aspect, the invention is a polynucleotide encoding the improved PGA polypeptide presented herein, operable to one or more regulatory sequences for expressing a PGA enzyme in a host cell. A host cell comprising a polynucleotide linked to is provided. Host cells used for the expression of PGA polypeptides encoded by the expression vectors of the present invention are well known in the art and include, but are not limited to, bacterial cells such as E. coli cells, Bacillus megaterium cells, Lactobacillus kefire cells, Streptomyces. Cells and Salmonella typhimurium cells; fungal cells such as yeast cells (eg, Saccharomyces cerevisiae or Pichia pastoris (ATCC accession number 2011178)); insect cells such as Drosophila S2 cells and SpodopterC cells; , COS cells, BHK cells, 293 cells, and Bowes melanoma Cells; and plant cells. Suitable culture media and growth conditions for the above host cells are well known in the art.

PGAを発現させるためのポリヌクレオチドは、当技術分野で公知の様々な方法によって細胞に導入され得る。技術としては、特に、電気穿孔、微粒子銃粒子ボンバードメント(biolistic particle bombardment)、リポソーム媒介トランスフェクション、塩化カルシウムトランスフェクション、およびプロトプラスト融合が挙げられる。ポリヌクレオチドを細胞に導入するための様々な方法は、当業者に公知である。   Polynucleotides for expressing PGA can be introduced into cells by various methods known in the art. Technologies include electroporation, biolistic particle bombardment, liposome-mediated transfection, calcium chloride transfection, and protoplast fusion, among others. Various methods for introducing polynucleotides into cells are known to those of skill in the art.

いくつかの実施形態では、宿主細胞は、真核細胞である。適切な真核生物宿主細胞としては、限定されないが、真菌細胞、藻類細胞、昆虫細胞、および植物細胞が挙げられる。適切な真菌宿主細胞としては、限定されないが、Ascomycota、Basidiomycota、Deuteromycota、Zygomycota、Fungi imperfectiが挙げられる。いくつかの実施形態では、真菌宿主細胞は、酵母細胞および糸状菌細胞である。本発明の糸状菌宿主細胞は、Eumycotina亜門およびOomycota亜門のすべての糸状形態を含む。糸状菌は、キチン、セルロースおよび他の複合多糖類で構成される細胞壁を有する栄養菌糸(vegetative mycelium)によって特徴付けられる。本発明の糸状菌宿主細胞は、酵母とは形態学的に別個のものである。   In some embodiments, the host cell is a eukaryotic cell. Suitable eukaryotic host cells include, but are not limited to, fungal cells, algal cells, insect cells, and plant cells. Suitable fungal host cells include, but are not limited to, Ascomycota, Basidiomycota, Deuteromyota, Zygomycota, Fungi impacti. In some embodiments, the fungal host cells are yeast cells and filamentous fungal cells. The filamentous fungal host cells of the present invention include all filamentous forms of the subgenus Emycotina and Omycota. Filamentous fungi are characterized by vegetative mycelium with cell walls composed of chitin, cellulose and other complex polysaccharides. The filamentous fungal host cell of the present invention is morphologically distinct from yeast.

本発明のいくつかの実施形態では、糸状菌宿主細胞は、限定されないが、Achlya、Acremonium、Aspergillus、Aureobasidium、Bjerkandera、Ceriporiopsis、Cephalosporium、Chrysosporium、Cochliobolus、Corynascus、Cryphonectria、Cryptococcus、Coprinus、Coriolus、Diplodia、Endothis、Fusarium、Gibberella、Gliocladium、Humicola、Hypocrea、Myceliophthora、Mucor、Neurospora、Penicillium、Podospora、Phlebia、Piromyces、Pyricularia、Rhizomucor、Rhizopus、Schizophyllum、Scytalidium、Sporotrichum、Talaromyces、Thermoascus、Thielavia、Trametes、Tolypocladium、Trichoderma、Verticillium、および/またはVolvariella、ならびに/あるいはこれらの完全世代、もしくは不完全世代、および同物異名、バソニム(basionym)、または分類学的等価物を含む、任意の適切な属および種のものである。   In some embodiments of the present invention, filamentous fungal host cells include, but are not limited to, Achlya, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Celipospiris, Cephalosporum, Chrysosporium, Chrysosporum, Chrysosporium, Endothis, Fusarium, Gibberella, Gliocladium, Humicola, Hypocrea, Myceliophthora, Mucor, Neurospora, Penicillium, Podspora, Phlebia, Pi omyces, Pyricularia, Rhizomucor, Rhizopus, Schizophyllum, Scytalidium, Sporotrichum, Talaromyces, Thermoascus, Thielavia, Trametes, Tolypocladium, Trichoderma, Verticillium, and / or Volvariella, and / or their full generation, or incomplete generations, and the things synonymy Of any suitable genus and species, including basionyms, or taxonomic equivalents.

本発明のいくつかの実施形態では、宿主細胞は、限定されないが、Candida、Hansenula、Saccharomyces、Schizosaccharomyces、Pichia、Kluyveromyces、またはYarrowia種の細胞を含む、酵母細胞である。本発明のいくつかの実施形態では、酵母細胞は、Hansenula polymorpha、Saccharomyces cerevisiae、Saccharomyces carlsbergensis、Saccharomyces diastaticus、Saccharomyces norbensis、Saccharomyces kluyveri、Schizosaccharomyces pombe、Pichia pastoris、Pichia finlandica、Pichia trehalophila、Pichia kodamae、Pichia membranaefaciens、Pichia opuntiae、Pichia thermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、Pichia stipitis、Pichia methanolica、Pichia angusta、Kluyveromyces lactis、Candida albicans、またはYarrowia lipolyticaである。   In some embodiments of the invention, the host cell is a yeast cell, including but not limited to cells of the Candida, Hansenula, Saccharomyces, Schizosaccharomyces, Pichia, Kluyveromyces, or Yarrowia species. In some embodiments of the present invention, yeast cells, Hansenula polymorpha, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces norbensis, Saccharomyces kluyveri, Schizosaccharomyces pombe, Pichia pastoris, Pichia finlandica, Pichia trehalophila, Pichia kodamae, Pichia membranaefaciens, Pichia openiae, Pichia thermotolerans, Pichia sali Taria, a Pichia quercuum, Pichia pijperi, Pichia stipitis, Pichia methanolica, Pichia angusta, Kluyveromyces lactis, Candida albicans, or Yarrowia lipolytica,.

本発明のいくつかの実施形態では、宿主細胞は、藻類細胞、例えば、Chlamydomonas(例えば、C.reinhardtii)およびPhormidium(P.sp. ATCC29409)である。   In some embodiments of the invention, the host cell is an algal cell, such as Chlamydomonas (eg, C. reinhardtii) and Phordium (P. sp. ATCC 29409).

いくつかの他の実施形態では、宿主細胞は、原核細胞である。適切な原核細胞としては、限定されないが、グラム陽性、グラム陰性およびグラム不定(gram-variable)細菌細胞が挙げられる。限定されないが、Agrobacterium、Alicyclobacillus、Anabaena、Anacystis、Acinetobacter、Acidothermus、Arthrobacter、Azobacter、Bacillus、Bifidobacterium、Brevibacterium、Butyrivibrio、Buchnera、Campestris、Camplyobacter、Clostridium、Corynebacterium、Chromatium、Coprococcus、Escherichia、Enterococcus、Enterobacter、Erwinia、Fusobacterium、Faecalibacterium、Francisella、Flavobacterium、Geobacillus、Haemophilus、Helicobacter、Klebsiella、Lactobacillus、Lactococcus、Ilyobacter、Micrococcus、Microbacterium、Mesorhizobium、Methylobacterium、Methylobacterium、Mycobacterium、Neisseria、Pantoea、Pseudomonas、Prochlorococcus、Rhodobacter、Rhodopseudomonas、Rhodopseudomonas、Roseburia、Rhodospirillum、Rhodococcus、Scenedesmus、Streptomyces、Streptococcus、Synecoccus、Saccharomonospora、Staphylococcus、Serratia、Salmonella、Shigella、Thermoanaerobacterium、Tropheryma、Tularensis、Temecula、Thermosynechococcus、Thermococcus、Ureaplasma、Xanthomonas、Xylella、YersiniaおよびZymomonasを含む任意の適切な細菌生物が本発明において使用される。いくつかの実施形態では、宿主細胞は、Agrobacterium、Acinetobacter、Azobacter、Bacillus、Bifidobacterium、Buchnera、Geobacillus、Campylobacter、Clostridium、Corynebacterium、Escherichia、Enterococcus、Erwinia、Flavobacterium、Lactobacillus、Lactococcus、Pantoea、Pseudomonas、Staphylococcus、Salmonella、Streptococcus、Streptomyces、またはZymomonasの菌種である。いくつかの実施形態では、細菌宿主株は、ヒトに対して非病原性である。いくつかの実施形態では、細菌宿主株は、工業用株である。多数の細菌工業用株が公知であり、本発明において適切である。本発明のいくつかの実施形態では、細菌宿主細胞は、Agrobacterium種(例えば、A.radiobacter、A.rhizogenes、およびA.rubi)である。本発明のいくつかの実施形態では、細菌宿主細胞は、Arthrobacter種(例えば、A.aurescens、A.citreus、A.globiformis、A.hydrocarboglutamicus、A.mysorens、A.nicotianae、A.paraffineus、A.protophonniae、A.roseoparqffinus、A.sulfureus、およびA.ureafaciens)である。本発明のいくつかの実施形態では、細菌宿主細胞は、Bacillus種(例えば、B.thuringensis、B.anthracis、B.megaterium、B.subtilis、B.lentus、B.circulans、B.pumilus、B.lautus、B.coagulans、B.brevis、B.firmus、B.alkaophius、B.licheniformis、B.clausii、B.stearothermophilus、B.halodurans、およびB.amyloliquefaciens)である。いくつかの実施形態では、宿主細胞は、限定されないが、B.subtilis、B.pumilus、B.licheniformis、B.megaterium、B.clausii、B.stearothermophilus、またはB.amyloliquefaciensを含む工業用Bacillus株である。いくつかの実施形態では、Bacillus宿主細胞は、B.subtilis、B.licheniformis、B.megaterium、B.stearothermophilus、および/またはB.amyloliquefaciensである。いくつかの実施形態では、細菌宿主細胞は、Clostridium種(例えば、C.acetobutylicum、C.tetani E88、C.lituseburense、C.saccharobutylicum、C.perfringens、およびC.beijerinckii)である。いくつかの実施形態では、細菌宿主細胞は、Corynebacterium種(例えば、C.glutamicumおよびC.acetoacidophilum)である。いくつかの実施形態では、細菌宿主細胞は、Escherichia種(例えば、大腸菌)である。いくつかの実施形態では、細菌宿主細胞は、Erwinia種(例えば、E.uredovora、E.carotovora、E.ananas、E.herbicola、E.punctata、およびE.terreus)である。いくつかの実施形態では、細菌宿主細胞は、Pantoea種(例えば、P.citrea、およびP.agglomerans)である。いくつかの実施形態では、細菌宿主細胞は、Pseudomonas種(例えば、P.putida、P.aeruginosa、P.mevalonii、およびP.sp. D−01 10)である。いくつかの実施形態では、細菌宿主細胞は、Streptococcus種(例えば、S.equisimiles、S.pyogenes、およびS.uberis)である。いくつかの実施形態では、細菌宿主細胞は、Streptomyces種(例えば、S.ambofaciens、S.achromogenes、S.avermitilis、S.coelicolor、S.aureofaciens、S.aureus、S.fungicidicus、S.griseus、およびS.lividans)である。いくつかの実施形態では、細菌宿主細胞は、Zymomonas種(例えば、Z.mobilis、およびZ.lipolytica)である。   In some other embodiments, the host cell is a prokaryotic cell. Suitable prokaryotic cells include, but are not limited to, gram positive, gram negative and gram-variable bacterial cells. But are not limited to, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Acinetobacter, Acidothermus, Arthrobacter, Azobacter, Bacillus, Bifidobacterium, Brevibacterium, Butyrivibrio, Buchnera, Campestris, Camplyobacter, Clostridium, Corynebacterium, Chromatium, Coprococcus, Escherichia, Enterococcus, Enterobacter, Erwinia, Fusobacterium, Faecalibacterium, Francisell , Flavobacterium, Geobacillus, Haemophilus, Helicobacter, Klebsiella, Lactobacillus, Lactococcus, Ilyobacter, Micrococcus, Microbacterium, Mesorhizobium, Methylobacterium, Methylobacterium, Mycobacterium, Neisseria, Pantoea, Pseudomonas, Prochlorococcus, Rhodobacter, Rhodopseudomonas, Rhodopseudomonas, Roseburia, Rhodospirillum, Rhodococcus, Scenedesmus , S reptomyces use, Streptococcus, Synecoccus, Saccharomonospora, Staphylococcus, Serratia, Salmonella, Shigella, Thermoanaerobacterium, Tropheryma, Tularensis, Temecula, Thermosynechococcus, Thermococcus, Ureaplasma, Xanthomonas, Xylella, in any suitable bacterial organisms present invention containing Yersinia and Zymomonas Is done. In some embodiments, the host cell, Agrobacterium, Acinetobacter, Azobacter, Bacillus, Bifidobacterium, Buchnera, Geobacillus, Campylobacter, Clostridium, Corynebacterium, Escherichia, Enterococcus, Erwinia, Flavobacterium, Lactobacillus, Lactococcus, Pantoea, Pseudomonas, Staphylococcus, Salmonella , Streptococcus, Streptomyces, or Zymomonas species. In some embodiments, the bacterial host strain is non-pathogenic to humans. In some embodiments, the bacterial host strain is an industrial strain. A number of bacterial industrial strains are known and suitable in the present invention. In some embodiments of the invention, the bacterial host cell is an Agrobacterium species (eg, A. radiobacter, A. rhizogenes, and A. rubi). In some embodiments of the invention, the bacterial host cell is an Arthrobacter species (e.g., A. aurescens, A. citreus, A. globiformis, A. hydrocarbaglutamicus, A. myorens, A. nicotianae, A. paraaffinus, A. protophonniae, A. roseparqfinus, A. sulfures, and A. urefaciens). In some embodiments of the present invention, the bacterial host cell is a Bacillus species (eg, B. thuringensis, B. anthracis, B. megaterium, B. subtilis, B. lentus, B. circulans, B. pumilus, B. pumilus). Lautus, B. coagulans, B. brevis, B. farmus, B. alkaophius, B. licheniformis, B. clausii, B. stearothermophilus, B. halodurans, and B. amyloliquefacien). In some embodiments, host cells include, but are not limited to B.I. subtilis, B.M. pumilus, B. et al. licheniformis, B.I. megaterium, B.M. clausii, B.I. stearothermophilus, or B.I. An industrial Bacillus strain containing amyloliquefaciens. In some embodiments, the Bacillus host cell is subtilis, B.M. licheniformis, B.I. megaterium, B.M. stearothermophilus, and / or B.I. amyloliquefaciens. In some embodiments, the bacterial host cell is a Clostridium species (eg, C. acetobutylicum, C. tetani E88, C. literoseburense, C. saccharobutyricum, C. perfringens, and C. beijerinckii). In some embodiments, the bacterial host cell is a Corynebacterium species (eg, C. glutamicum and C. acetoacidophilum). In some embodiments, the bacterial host cell is an Escherichia species (eg, E. coli). In some embodiments, the bacterial host cell is an Erwinia species (eg, E. uredovora, E. carotovora, E. ananas, E. herbicola, E. puncata, and E. terreus). In some embodiments, the bacterial host cell is a Pantoea species (eg, P. citrea, and P. agglomerans). In some embodiments, the bacterial host cell is a Pseudomonas species (eg, P. putida, P. aeruginosa, P. mevalonii, and P. sp. D-01 10). In some embodiments, the bacterial host cell is a Streptococcus species (eg, S. equisimiles, S. pyogenes, and S. ubelis). In some embodiments, the bacterial host cell is a Streptomyces sp. S. lividans). In some embodiments, the bacterial host cell is a Zymomonas species (eg, Z. mobilis, and Z. lipolytica).

例示的な宿主細胞は、大腸菌W3110である。改善されたPGAをコードするポリヌクレオチドを、lacIリプレッサーの制御下でlacプロモーターに作動可能に連結されたプラスミドpCK110900と作動可能に連結させることによって発現ベクターを作製した。発現ベクターは、P15a複製起点およびクロラムフェニコール耐性遺伝子も含有した。大腸菌W3110内の対象ポリヌクレオチドを含有する細胞を、細胞をクロラムフェニコール選択に供することによって単離した。   An exemplary host cell is E. coli W3110. An expression vector was generated by operably linking a polynucleotide encoding the improved PGA to plasmid pCK110900 operably linked to the lac promoter under the control of the lacI repressor. The expression vector also contained a P15a origin of replication and a chloramphenicol resistance gene. Cells containing the polynucleotide of interest in E. coli W3110 were isolated by subjecting the cells to chloramphenicol selection.

本発明において使用される多くの原核生物株および真核生物株は、American Type Culture Collection(ATCC)、Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)、およびAgricultural Research Service Patent Culture Collection、Northern Regional Research Center(NRRL)などのいくつもの培養物コレクションから、公的に容易に入手可能である。   A number of prokaryotic and eukaryotic strains used in the present invention are the American Type Culture Collection (ATCC), Deutsche Sulturer ul Sulchul von Mulorganismen und Zellkulturn GmbH (DSM), Central Publicly and readily available from a number of culture collections such as Collection, Northern Regional Research Center (NRRL).

いくつかの実施形態では、宿主細胞を、タンパク質分泌、タンパク質安定性ならびに/またはタンパク質の発現および/もしくは分泌のために望ましい他の特性が改善される特性を有するように遺伝子改変する。遺伝子改変は、遺伝子工学の技術および/または古典的な微生物学的技術(例えば、化学的なまたはUV変異誘発およびその後の選択)によって達成することができる。実際に、いくつかの実施形態では、組換えによる改変と古典的な選択技術の組み合わせを使用して宿主細胞を生産する。組換え技術を使用して、核酸分子を、宿主細胞中および/または培養培地中でのPGA改変体(複数可)の収量の増加がもたらされる様式で導入する、欠失させる、阻害する、または改変することができる。例えば、Alp1機能のノックアウトにより、プロテアーゼが欠損した細胞がもたらされ、pyr5機能のノックアウトにより、ピリミジン欠損表現型を有する細胞がもたらされる。1つの遺伝子工学手法では、コードされるタンパク質の発現を抑制するために、相同組換えを使用して、インビボで遺伝子を特異的に標的化することによる標的化遺伝子改変を誘導する。代替の手法では、遺伝子発現の阻害にsiRNA、アンチセンスおよび/またはリボザイム技術を使用する。限定されないが、タンパク質をコードする遺伝子の全部または一部の欠失、および遺伝子産物の発現または活性を破壊する部位特異的変異誘発を含む、細胞におけるタンパク質の発現を低下させるための様々な方法が当技術分野で公知である(例えば、すべてが参照により本明細書に組み込まれる、Chaverocheら、Nucl. Acids Res.、28巻:22号、e97頁、[2000年];Choら、Molec. Plant Microbe Interact.、19巻:7〜15頁、[2006年];MaruyamaおよびKitamoto、Biotechnol Lett.、30巻:1811〜1817頁、[2008年];Takahashiら、Mol. Gen. Genom.、272巻:344〜352頁、[2004年];ならびにYouら、Arch. Micriobiol.、191巻:615〜622頁、[2009年]を参照のこと)。ランダム変異誘発、その後の所望の変異についてのスクリーニングも使用される(例えば、その両方が参照により組み込まれるCombierら、FEMS Microbiol. Lett.、220巻:141〜8頁、[2003年];およびFironら、Eukary. Cell、2巻:247〜55頁、[2003年]を参照のこと)。   In some embodiments, the host cell is genetically modified to have properties that improve protein secretion, protein stability, and / or other properties desirable for protein expression and / or secretion. Genetic modification can be accomplished by genetic engineering techniques and / or classical microbiological techniques (eg, chemical or UV mutagenesis and subsequent selection). Indeed, in some embodiments, host cells are produced using a combination of recombinant modification and classical selection techniques. Using recombinant technology, the nucleic acid molecule is introduced, deleted, inhibited or inhibited in a manner that results in increased yield of PGA variant (s) in the host cell and / or in the culture medium. Can be modified. For example, knockout of Alp1 function results in cells that are deficient in protease, and knockout of pyr5 function results in cells that have a pyrimidine deficient phenotype. In one genetic engineering approach, homologous recombination is used to induce targeted genetic modification by specifically targeting a gene in vivo in order to suppress expression of the encoded protein. Alternative approaches use siRNA, antisense and / or ribozyme technology to inhibit gene expression. Various methods for reducing the expression of a protein in a cell include, but are not limited to, deletion of all or part of the gene encoding the protein and site-directed mutagenesis that disrupts the expression or activity of the gene product. Known in the art (eg, Chaveroche et al., Nucl. Acids Res., 28:22, e97, [2000]; all incorporated herein by reference; Cho et al., Molec. Plant Microbe Interact., 19: 7-15, [2006]; Maruyama and Kitamoto, Biotechnol Lett., 30: 1811-1817, [2008]; Takahashi et al., Mol. Gen. Genom., 272 : 344-352, [2004]; and You et al., Arch. Micriobiol., 191: 615-622, [2009]). Random mutagenesis followed by screening for the desired mutation is also used (eg Combier et al., FEMS Microbiol. Lett., 220: 141-8, [2003], both of which are incorporated by reference; and Firon Et al., Eukary. Cell, 2: 247-55, [2003]).

ベクターまたはDNA構築物の宿主細胞への導入は、限定されないが、リン酸カルシウムトランスフェクション、DEAE−デキストラン媒介トランスフェクション、PEG媒介形質転換、電気穿孔、または他の当技術分野で公知の一般的な技術を含む、当技術分野で公知の任意の適切な方法を使用して達成することができる。   Introduction of a vector or DNA construct into a host cell includes, but is not limited to, calcium phosphate transfection, DEAE-dextran mediated transfection, PEG mediated transformation, electroporation, or other common techniques known in the art. This can be accomplished using any suitable method known in the art.

いくつかの実施形態では、本発明の操作された宿主細胞(すなわち、「組換え宿主細胞」)を、プロモーターを活性化するため、形質転換体を選択するため、またはPGAポリヌクレオチドを増幅するために必要に応じて改変した従来の栄養培地中で培養する。例えば温度、pHなどの培養条件は、発現のために選択された宿主細胞に以前使用したものであり、当業者には周知である。記載の通り、細菌起源、植物起源、動物(特に哺乳動物)起源および古細菌起源の細胞を含む多くの細胞の培養および生産のために、多くの標準的な参照およびテキストが利用可能である。   In some embodiments, engineered host cells of the invention (ie, “recombinant host cells”) are used to activate promoters, select transformants, or amplify PGA polynucleotides. And cultured in a conventional nutrient medium modified as necessary. Culture conditions such as temperature, pH, etc. are those previously used for the host cell selected for expression and are well known to those skilled in the art. As described, many standard references and texts are available for the culture and production of many cells, including cells of bacterial, plant, animal (especially mammalian) and archaeal origin.

いくつかの実施形態では、本発明の改変体PGAポリペプチドを発現する細胞を、バッチ発酵条件または連続発酵条件の下で成長させる。古典的な「バッチ発酵」は、閉鎖系であり、培地の組成は発酵の開始時に設定し、発酵中に人為的な交換には供さない。「流加発酵」はバッチ系のバリエーションであり、これも本発明において使用される。このバリエーションでは、発酵が進行するにしたがって基質を徐々に増加させて添加する。流加系は、異化産物抑制により細胞の代謝が阻害される可能性がある場合、および培地中の基質を限られた量にすることが望ましい場合に有用である。バッチ発酵および流加発酵は一般的であり、当技術分野で周知である。「連続発酵」は、開放系であり、規定の発酵培地をバイオリアクターに連続的に添加し、同時に処理のために等量の馴化培地を取り出す。連続発酵では、一般に、培養物を、細胞が主に対数期成長にある、一定の高密度に維持する。連続発酵系では、定常状態の成長条件を維持しようとする。連続発酵プロセスのために栄養分および増殖因子を調節するための方法ならびに生成物が形成される速度を最大にするための技術は、工業微生物学の技術分野で周知である。   In some embodiments, cells expressing a variant PGA polypeptide of the invention are grown under batch or continuous fermentation conditions. The classic “batch fermentation” is a closed system where the medium composition is set at the start of the fermentation and is not subject to artificial replacement during the fermentation. “Fed-batch fermentation” is a variation of a batch system and is also used in the present invention. In this variation, the substrate is gradually increased and added as the fermentation progresses. The fed-batch system is useful when cell metabolism may be inhibited by catabolite repression and when it is desirable to have a limited amount of substrate in the medium. Batch fermentation and fed-batch fermentation are common and well known in the art. “Continuous fermentation” is an open system in which a defined fermentation medium is continuously added to the bioreactor and an equal volume of conditioned medium is removed for processing. In continuous fermentation, the culture is generally maintained at a constant high density where the cells are primarily in log phase growth. Continuous fermentation systems attempt to maintain steady state growth conditions. Methods for adjusting nutrients and growth factors for continuous fermentation processes and techniques for maximizing the rate at which products are formed are well known in the art of industrial microbiology.

本発明のいくつかの実施形態では、改変体PGA(複数可)の生産に無細胞転写/翻訳系を使用する。いくつかの系が市販されており、方法は当業者に周知である。   In some embodiments of the invention, a cell-free transcription / translation system is used for production of the variant PGA (s). Several systems are commercially available and methods are well known to those skilled in the art.

本発明は、改変体PGAポリペプチドまたは生物学的に活性なその断片の作製方法を提供する。いくつかの実施形態では、方法は、配列番号2に対して少なくとも約70%(または少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%)の配列同一性を含み、本明細書において提示される少なくとも1つの変異を含むアミノ酸配列をコードするポリヌクレオチドで形質転換された宿主細胞を提供すること;宿主細胞がコードされた改変体PGAポリペプチドを発現する条件下で、培養培地中で形質転換された宿主細胞を培養すること;ならびに場合により、発現された改変体PGAポリペプチドを回収もしくは単離すること、および/または、発現された改変体PGAポリペプチドを含有する培養培地を回収もしくは単離することを含む。いくつかの実施形態では、方法は、場合により、コードされるPGAポリペプチドの発現後に形質転換された宿主細胞を溶解すること、ならびに場合により、発現された改変体PGAポリペプチドを細胞溶解産物から回収および/または単離することをさらに提供する。本発明は、改変体PGAポリペプチドで形質転換された宿主細胞を、改変体PGAポリペプチドの生成に適した条件下で培養すること、および改変体PGAポリペプチドを回収することを含む、改変体PGAポリペプチドの作製方法をさらに提供する。一般には、PGAポリペプチドの回収または単離は、宿主細胞の培養培地、宿主細胞、またはその両方から、本明細書に記載されるものを含む当技術分野で周知のタンパク質回収技術を使用したものである。いくつかの実施形態では、宿主細胞を遠心分離によって回収し、物理的または化学的手段によって破壊し、得られた粗製抽出物をさらなる精製のために保持する。タンパク質の発現において用いられる微生物細胞は、限定されないが、凍結解凍サイクリング、超音波処理、機械的破壊、および/または細胞溶解剤の使用、ならびに当業者に周知の多くの他の適切な方法を含む任意の便利な方法によって破壊することができる。   The present invention provides methods for making variant PGA polypeptides or biologically active fragments thereof. In some embodiments, the method is at least about 70% (or at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96 relative to SEQ ID NO: 2. %, At least about 97%, at least about 98%, or at least about 99%) and having been transformed with a polynucleotide encoding an amino acid sequence comprising at least one mutation presented herein Providing a host cell; culturing the transformed host cell in a culture medium under conditions that allow the host cell to express the encoded variant PGA polypeptide; and optionally expressing the variant PGA. Recovering or isolating the polypeptide and / or containing the expressed variant PGA polypeptide The culture medium in which to include recovering or isolation. In some embodiments, the method optionally lyses the transformed host cell after expression of the encoded PGA polypeptide, and optionally removes the expressed variant PGA polypeptide from the cell lysate. It is further provided to recover and / or isolate. The present invention relates to a variant comprising culturing a host cell transformed with a variant PGA polypeptide under conditions suitable for production of the variant PGA polypeptide, and recovering the variant PGA polypeptide. Further provided are methods of making PGA polypeptides. In general, recovery or isolation of PGA polypeptides is accomplished using protein recovery techniques well known in the art, including those described herein, from host cell culture media, host cells, or both. It is. In some embodiments, host cells are harvested by centrifugation, disrupted by physical or chemical means, and the resulting crude extract is retained for further purification. Microbial cells used in protein expression include, but are not limited to, freeze-thaw cycling, sonication, mechanical disruption, and / or the use of cytolytic agents and many other suitable methods well known to those skilled in the art. Can be destroyed by any convenient method.

宿主細胞において発現された操作されたPGA酵素は、特に、リゾチーム処理、超音波処理、濾過、塩析、超遠心分離、およびクロマトグラフィーを含む、タンパク質精製のための周知の技術の任意の1つまたは複数を使用して細胞および/または培養培地から回収され得る。大腸菌などの細菌からのタンパク質の溶解および高効率での抽出のための適切な溶液は、商品名CelLytic B(商標)(Sigma−Aldrich)で市販されている。したがって、いくつかの実施形態では、得られたポリペプチドを回収/単離し、場合により、当技術分野で公知のいくつもの方法のいずれかによって精製する。例えば、いくつかの実施形態では、ポリペプチドを、限定されないが、遠心分離、濾過、抽出、噴霧乾燥、蒸発、クロマトグラフィー(例えば、イオン交換、アフィニティー、疎水性相互作用、クロマトフォーカシング、およびサイズ排除)、または沈殿を含む従来の手順によって栄養培地から単離する。いくつかの実施形態では、所望の通り、成熟タンパク質の立体配置の完成において、タンパク質リフォールディングステップを使用する。さらに、いくつかの実施形態では、最終的な精製ステップにおいて高速液体クロマトグラフィー(HPLC)を用いる。例えば、いくつかの実施形態では、当技術分野で公知の方法が本発明において使用される(例えば、その両方が参照により本明細書に組み込まれる、Parryら、Biochem. J.、353巻:117頁、[2001年];およびHongら、Appl. Microbiol. Biotechnol.、73巻:1331頁、[2007年]を参照のこと)。実際に、当技術分野で公知の任意の適切な精製方法が本発明において使用される。   Engineered PGA enzymes expressed in host cells can be any one of well-known techniques for protein purification, including lysozyme treatment, sonication, filtration, salting out, ultracentrifugation, and chromatography, among others. Or a plurality can be used to recover from cells and / or culture media. A suitable solution for lysis and high efficiency extraction of proteins from bacteria such as E. coli is commercially available under the trade name CelLytic B ™ (Sigma-Aldrich). Thus, in some embodiments, the resulting polypeptide is recovered / isolated and optionally purified by any of a number of methods known in the art. For example, in some embodiments, the polypeptide can be, but is not limited to, centrifugation, filtration, extraction, spray drying, evaporation, chromatography (eg, ion exchange, affinity, hydrophobic interaction, chromatofocusing, and size exclusion) Or isolated from the nutrient medium by conventional procedures involving precipitation. In some embodiments, a protein refolding step is used in completing the configuration of the mature protein, as desired. Further, in some embodiments, high performance liquid chromatography (HPLC) is used in the final purification step. For example, in some embodiments, methods known in the art are used in the present invention (eg, Parry et al., Biochem. J., 353: 117, both of which are incorporated herein by reference). P., [2001]; and Hong et al., Appl. Microbiol. Biotechnol., 73: 1331, [2007]). Indeed, any suitable purification method known in the art may be used in the present invention.

PGAポリペプチドを単離するためのクロマトグラフィー技術としては、限定されないが、逆相クロマトグラフィー、高速液体クロマトグラフィー、イオン交換クロマトグラフィー、ゲル電気泳動、およびアフィニティークロマトグラフィーが挙げられる。特定の酵素を精製するための条件は、正味の電荷、疎水性、親水性、分子量、分子形状などの要因に部分的に依存し、当業者には公知である。   Chromatographic techniques for isolating PGA polypeptides include, but are not limited to, reverse phase chromatography, high performance liquid chromatography, ion exchange chromatography, gel electrophoresis, and affinity chromatography. The conditions for purifying a particular enzyme depend in part on factors such as net charge, hydrophobicity, hydrophilicity, molecular weight, molecular shape, and are known to those skilled in the art.

いくつかの実施形態では、親和性技術が改善されたPGA酵素の単離に使用される。アフィニティークロマトグラフィー精製のために、PGAポリペプチドに特異的に結合する任意の抗体を使用し得る。抗体の産生のために、PGAによる注射によって、限定されないが、ウサギ、マウス、ラットなどを含む様々な宿主動物を免疫し得る。側鎖官能基によって、または側鎖官能基に結合したリンカーによって、PGAポリペプチドをBSAなどの適切な担体に結合させ得る。免疫学的応答を増大させるために、宿主種に応じて、限定されないが、フロイント(完全および不完全)、水酸化アルミニウムなどの無機ゲル、リゾレシチンなどの表面活性物質、プルロニックポリオール、ポリアニオン、ペプチド、油乳剤、キーホールリンペットヘモシアニン、ジニトロフェノール、ならびにBCG(Bacillus Calmette Guerin)およびCorynebacterium parvumなどの潜在的に有用なヒトアジュバントを含む様々なアジュバントを使用し得る。   In some embodiments, affinity techniques are used to isolate PGA enzymes with improved. Any antibody that specifically binds to a PGA polypeptide may be used for affinity chromatography purification. For the production of antibodies, various host animals can be immunized by injection with PGA, including but not limited to rabbits, mice, rats, and the like. The PGA polypeptide can be attached to a suitable carrier such as BSA by a side chain functional group or by a linker attached to the side chain functional group. To increase the immunological response, depending on the host species, but not limited to, Freund (complete and incomplete), inorganic gels such as aluminum hydroxide, surfactants such as lysolecithin, pluronic polyols, polyanions, peptides, Various adjuvants can be used including oil emulsions, keyhole limpet hemocyanin, dinitrophenol, and potentially useful human adjuvants such as BCG (Bacillus Calmette Guerin) and Corynebacterium parvum.

いくつかの実施形態では、PGA改変体を調製し、酵素を発現する細胞の形態で、粗製抽出物として、または単離もしくは精製された調製物として使用する。いくつかの実施形態では、PGA改変体を凍結乾燥物として、粉末(例えば、アセトン粉末)の形態で、または酵素溶液として調製する。いくつかの実施形態では、PGA改変体は、実質的に純粋な調製物の形態である。   In some embodiments, PGA variants are prepared and used in the form of cells expressing the enzyme, as a crude extract, or as an isolated or purified preparation. In some embodiments, the PGA variant is prepared as a lyophilizate, in the form of a powder (eg, acetone powder), or as an enzyme solution. In some embodiments, the PGA variant is in the form of a substantially pure preparation.

いくつかの実施形態では、PGAポリペプチドを任意の適切な固体基材に結合させる。固体基材としては、限定されないが、固相、表面、および/または膜が挙げられる。固体支持体としては、限定されないが、ポリスチレン、ポリエチレン、ポリプロピレン、ポリフルオロエチレン、ポリエチレンオキシ、およびポリアクリルアミド、ならびにそれらのコポリマーおよびグラフトなどの有機ポリマーが挙げられる。固体支持体はまた、無機物、例えばガラス、シリカ、制御細孔ガラス(CPG)、逆相シリカまたは金属、例えば金または白金であり得る。基材の形状は、ビーズ、スフィア、粒子、顆粒、ゲル、膜または面の形態であり得る。面は、平面、実質的な平面または非平面であり得る。固体支持体は、多孔性または非多孔性であり得、膨潤特性または非膨潤特性を有し得る。固体支持体は、ウェル、凹部または他の入れ物、容器、特徴または位置の形態で形成され得る。試薬のロボット送達が処理可能な様々な場所において、または検出方法および/もしくは機器によって処理可能な様々な場所において、複数の支持体がアレイ上に配置され得る。   In some embodiments, the PGA polypeptide is bound to any suitable solid substrate. Solid substrates include, but are not limited to, solid phases, surfaces, and / or membranes. Solid supports include, but are not limited to, organic polymers such as polystyrene, polyethylene, polypropylene, polyfluoroethylene, polyethyleneoxy, and polyacrylamide, and copolymers and grafts thereof. The solid support can also be inorganic, such as glass, silica, controlled pore glass (CPG), reverse phase silica or metal, such as gold or platinum. The shape of the substrate can be in the form of beads, spheres, particles, granules, gels, membranes or faces. The surface can be planar, substantially planar, or non-planar. The solid support can be porous or non-porous and can have swelling or non-swelling properties. The solid support can be formed in the form of a well, recess or other container, container, feature or location. Multiple supports can be placed on the array at various locations where robotic delivery of reagents can be processed, or at various locations where it can be processed by detection methods and / or instruments.

いくつかの実施形態では、免疫学的方法を使用してPGA改変体を精製する。1つの手法では、従来の方法を使用して改変体PGAポリペプチドに対して(例えば、配列番号2、4、6、8、10、もしくは12のいずれかを含むポリペプチドおよび/またはそれらの免疫原性断片に対して)生じさせた抗体をビーズ上に固定化し、改変体PGAが結合する条件下で細胞培養培地と混合し、沈殿させる。関連する手法では、免疫クロマトグラフィーが使用される。   In some embodiments, PGA variants are purified using immunological methods. In one approach, a conventional method is used against a variant PGA polypeptide (eg, a polypeptide comprising any of SEQ ID NO: 2, 4, 6, 8, 10, or 12 and / or their immunity). The resulting antibody (against the original fragment) is immobilized on the beads, mixed with the cell culture medium under conditions where the modified PGA binds and precipitated. A related approach uses immunochromatography.

いくつかの実施形態では、改変体PGAを、非酵素部分を含む融合タンパク質として発現させる。いくつかの実施形態では、改変体PGA配列を、精製を容易にするドメインと融合する。本明細書で使用される場合、用語「精製を容易にするドメイン」は、それが融合しているポリペプチドの精製を媒介するドメインを指す。適切な精製ドメインとしては、限定されないが、金属キレート化ペプチド、固定化された金属上での精製を可能にするヒスチジン−トリプトファンモジュール、グルタチオンに結合する配列(例えば、GST)、赤血球凝集素(HA)タグ(インフルエンザ赤血球凝集素タンパク質に由来するエピトープに対応する;例えば、Wilsonら、Cell、37巻:767頁、[1984年]を参照のこと)、マルトース結合性タンパク質配列、FLAGS伸長/アフィニティー精製システムにおいて利用されるFLAGエピトープ(例えば、Immunex Corpから入手可能なシステム)などが挙げられる。本明細書に記載される組成物および方法における使用が意図される1つの発現ベクターは、エンテロキナーゼ切断部位によって分離された、ポリヒスチジン領域と融合した本発明のポリペプチドを含む融合タンパク質の発現をもたらす。ヒスチジン残基は、IMIAC(固定化された金属イオンアフィニティークロマトグラフィー;例えば、Porathら、Prot. Exp. Purif.、3巻:263〜281頁、[1992年]を参照のこと)での精製を容易にし、エンテロキナーゼ切断部位は、改変体PGAポリペプチドを融合タンパク質から分離するための手段を提供する。外来ポリペプチドをグルタチオンSトランスフェラーゼ(GST)との融合タンパク質として発現させるために、pGEXベクター(Promega)も使用され得る。一般に、このような融合タンパク質は可溶性であり、溶解細胞から、リガンド−アガロースビーズ(例えば、GST融合物の場合にはグルタチオン−アガロース)への吸着、その後の遊離のリガンドの存在下での溶出によって容易に精製され得る。
実験
In some embodiments, the variant PGA is expressed as a fusion protein that includes a non-enzymatic moiety. In some embodiments, the variant PGA sequence is fused to a domain that facilitates purification. As used herein, the term “domain that facilitates purification” refers to a domain that mediates purification of the polypeptide to which it is fused. Suitable purification domains include, but are not limited to, metal chelating peptides, histidine-tryptophan modules that allow purification on immobilized metal, sequences that bind glutathione (eg, GST), hemagglutinin (HA) ) Tag (corresponds to an epitope derived from influenza hemagglutinin protein; see, eg, Wilson et al., Cell, 37: 767, [1984]), maltose binding protein sequence, FLAGS extension / affinity purification FLAG epitopes utilized in the system (for example, a system available from Immunex Corp) and the like. One expression vector intended for use in the compositions and methods described herein is for expression of a fusion protein comprising a polypeptide of the invention fused to a polyhistidine region separated by an enterokinase cleavage site. Bring. Histidine residues can be purified by IMIAC (immobilized metal ion affinity chromatography; see, for example, Porath et al., Prot. Exp. Purif., 3: 263-281 [1992]). Facilitating, the enterokinase cleavage site provides a means for separating the variant PGA polypeptide from the fusion protein. PGEX vectors (Promega) can also be used to express foreign polypeptides as fusion proteins with glutathione S transferase (GST). In general, such fusion proteins are soluble and can be adsorbed from lysed cells to ligand-agarose beads (eg, glutathione-agarose in the case of GST fusions) followed by elution in the presence of free ligand. It can be easily purified.
Experiment

以下の代表的な実施例において、本開示の様々な特徴および実施形態を例証するが、これらは例示的なものであり、限定的なものではない。   In the following representative examples, various features and embodiments of the present disclosure are illustrated, but are exemplary and not limiting.

以下の実験的開示では、以下の略語が適用される:ppm(百万分率);M(モル濃度);mM(ミリモル濃度)、uMおよびμM(マイクロモル濃度);nM(ナノモル濃度);mol(モル);gmおよびg(グラム);mg(ミリグラム);ugおよびμg(マイクログラム);Lおよびl(リットル);mlおよびmL(ミリリットル);cm(センチメートル);mm(ミリメートル);umおよびμm(マイクロメートル);sec.(秒);min(分);hおよびhr(時間);U(単位);MW(分子量);rpm(1分当たりの回転数);℃(摂氏度);RT(室温);CDS(コード配列);DNA(デオキシリボ核酸);RNA(リボ核酸);TB(Terrific Broth;12g/Lのバクト−トリプトン、24g/Lの酵母抽出物、4mL/Lのグリセロール、65mMのリン酸カリウム、pH7.0、1mMのMgSO);CAM(クロラムフェニコール);PMBS(硫酸ポリミキシンB);IPTG(イソプロピルチオガラクトシド);TFA(トリフルオロ酢酸);HPLC(高速液体クロマトグラフィー);FIOPC(陽性対照に対する改善倍率);HTP(ハイスループット);LB(ルリアブロス);Codexis(Codexis,Inc.、Redwood City、CA);Sigma−Aldrich(Sigma−Aldrich、St.Louis、MO);Millipore(Millipore,Corp.、Billerica MA);Difco(Difco Laboratories、BD Diagnostic Systems、Detroit、MI);Daicel(Daicel、West Chester、PA);Genetix(Genetix USA,Inc.、Beaverton、OR);Molecular Devices(Molecular Devices,LLC、Sunnyvale、CA);Applied Biosystems(Applied Biosystems、Life Technologies,Corp.の一部門、Grand Island、NY)、Agilent(Agilent Technologies,Inc.、Santa Clara、CA);Thermo Scientific(Thermo Fisher Scientificの一部門、Waltham、MA);(Infors;Infors−HT、Bottmingen/Basel、Switzerland);Corning(Corning,Inc.、Palo Alto、CA);およびBio−Rad(Bio−Rad Laboratories、Hercules、CA);Microfluidics(Microfluidics Corp.、Newton、MA、United States of America)。 In the following experimental disclosure, the following abbreviations apply: ppm (parts per million); M (molar); mM (molar), uM and μM (micromolar); nM (nanomolar); g (milligram); mg (milligram); ug and μg (microgram); L and l (liter); ml and mL (milliliter); cm (centimeter); mm (millimeter); um and μm (micrometers); sec. (Seconds); min (minutes); h and hr (hours); U (units); MW (molecular weight); rpm (number of revolutions per minute); ° C (degrees Celsius); RT (room temperature); DNA (deoxyribonucleic acid); RNA (ribonucleic acid); TB (Terrific Broth; 12 g / L bacto-tryptone, 24 g / L yeast extract, 4 mL / L glycerol, 65 mM potassium phosphate, pH 7. 0, 1 mM MgSO 4 ); CAM (chloramphenicol); PMBS (polymyxin B sulfate); IPTG (isopropylthiogalactoside); TFA (trifluoroacetic acid); HPLC (high performance liquid chromatography); FIOPC (positive control) Improvement magnification); HTP (high throughput); LB (Luria broth); Codexis (Code is, Inc., Redwood City, CA); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Millipore (Millipore, Corp., Billerica MA); Daicel (Daicel, West Chester, PA); Genetix (Genetics USA, Inc., Beaverton, OR); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Applied T Department of ies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, Calif.); Thermo Scientific (Thermo Scientific, Inf., MA; Botmingen / Basel, Switzerland); Corning (Corning, Inc., Palo Alto, Calif.); And Bio-Rad (Bio-Rad Laboratories, Hercules, Calif.); Microfluidics (Microfluidics Corp, a. .

以下の配列が本発明において使用される。
配列番号1(PGA WTポリヌクレオチド配列)
配列番号2(PGA WTポリペプチド配列)
配列番号3(PGA 改変体1ポリヌクレオチド配列)
配列番号4(PGA 改変体1ポリペプチド配列)
配列番号5(PGA 改変体6ポリヌクレオチド配列)
配列番号6(PGA 改変体6ポリペプチド配列)
配列番号7(PGA 改変体53ポリヌクレオチド配列)
配列番号8(PGA 改変体53ポリペプチド配列)
配列番号9(PGA 改変体261ポリヌクレオチド配列)
配列番号10(PGA 改変体261ポリペプチド配列)
配列番号11(PGA 改変体258ポリヌクレオチド配列)
配列番号12(PGA 改変体258ポリペプチド配列)
The following sequences are used in the present invention.
SEQ ID NO: 1 (PGA WT polynucleotide sequence)
SEQ ID NO: 2 (PGA WT polypeptide sequence)
SEQ ID NO: 3 (PGA variant 1 polynucleotide sequence)
SEQ ID NO: 4 (PGA variant 1 polypeptide sequence)
SEQ ID NO: 5 (PGA variant 6 polynucleotide sequence)
SEQ ID NO: 6 (PGA variant 6 polypeptide sequence)
SEQ ID NO: 7 (PGA variant 53 polynucleotide sequence)
SEQ ID NO: 8 (PGA variant 53 polypeptide sequence)
SEQ ID NO: 9 (PGA variant 261 polynucleotide sequence)
SEQ ID NO: 10 (PGA variant 261 polypeptide sequence)
SEQ ID NO: 11 (PGA variant 258 polynucleotide sequence)
SEQ ID NO: 12 (PGA variant 258 polypeptide sequence)

(実施例1)
組換えPGA遺伝子を含有する大腸菌発現宿主
本発明の改変体を生産するために使用する最初のPGA酵素をCodex(登録商標)Acylase Panel(Codexis)から得た。PGAパネルプレートは、野生型Kluyvera citrophila PGAと比較して改善された特性を有する操作されたPGAポリペプチドのコレクションを含む。野生型PGA遺伝子は、54アミノ酸のスペーサー領域によって連結されたαサブユニット(23.8KDa)およびβサブユニット(62.2KDa)からなるヘテロ二量体である。スペーサー領域が存在することに起因して、活性なタンパク質を形成するためには自己プロセシングステップが必要である。野生型遺伝子を改変してスペーサー領域を排除し、したがって、自己プロセシングステップを排除した。Codex(登録商標)Acylase Panel(Codexis)は、スペーサー領域を欠くPGA改変体を含有する(例えば、米国特許出願公開第2010/0143968A1号を参照のこと)。PGAをコードする遺伝子を、laclリプレッサーの制御下でlacプロモーターに作動可能に連結された発現ベクターpCK110900(米国特許出願公開第2006/0195947号の図3を参照のこと)にクローニングした。発現ベクターは、P15a複製起点およびクロラムフェニコール耐性遺伝子も含有する。得られたプラスミドを、当技術分野で公知の標準の方法を使用して大腸菌W3110に形質転換した。当技術分野で公知の通り細胞をクロラムフェニコール選択に供することによって形質転換体を単離した(例えば、米国特許第8,383,346号およびWO2010/144103を参照のこと)。
Example 1
E. coli expression host containing recombinant PGA gene The first PGA enzyme used to produce the variants of the present invention was obtained from Codex® Aylase Panel (Codexis). PGA panel plates contain a collection of engineered PGA polypeptides with improved properties compared to wild type Kluyvera citrophila PGA. The wild type PGA gene is a heterodimer consisting of an α subunit (23.8 KDa) and a β subunit (62.2 KDa) linked by a 54 amino acid spacer region. Due to the presence of the spacer region, a self-processing step is required to form an active protein. The wild type gene was modified to eliminate the spacer region and thus eliminate the self-processing step. Codex® Aylase Panel (Codexis) contains PGA variants that lack a spacer region (see, eg, US Patent Application Publication No. 2010 / 0143968A1). The gene encoding PGA was cloned into the expression vector pCK110900 (see FIG. 3 of US 2006/0195947) operably linked to the lac promoter under the control of the lac1 repressor. The expression vector also contains a P15a origin of replication and a chloramphenicol resistance gene. The resulting plasmid was transformed into E. coli W3110 using standard methods known in the art. Transformants were isolated by subjecting cells to chloramphenicol selection as known in the art (see, eg, US Pat. No. 8,383,346 and WO 2010/144103).

(実施例2)
HTP PGAを含有する湿潤細胞ペレットの調製
モノクローナルコロニー由来の、組換えPGAをコードする遺伝子を含有する大腸菌細胞を、96ウェルシャローウェルマイクロタイタープレートのウェル中、1%グルコースおよび30μg/mLクロラムフェニコールを含有する180μl LBに接種した。培養物を30℃、200rpm、および85%湿度で一晩成長させた。次いで、各細胞培養物10μlを、TB 390mLおよび30μg/mL CAMを含有する96ウェルディープウェルプレートのウェルに移した。ディープウェルプレートを30℃、250rpm、および85%湿度で3時間インキュベートした(OD600、0.6〜0.8)。次いで、細胞培養物を、最終濃度を1mMにしたIPTGによって誘導し、最初に使用したのと同じ条件で一晩インキュベートした。次いで、4000rpmで10分間の遠心分離を使用して細胞をペレット化した。上清を廃棄し、ペレットを、溶解前に−80℃で凍結させた。
(Example 2)
Preparation of Wet Cell Pellets Containing HTP PGA E. coli cells derived from monoclonal colonies containing the gene encoding recombinant PGA were transferred to 1% glucose and 30 μg / mL chlorampheny in the wells of a 96 well shallow well microtiter plate. Inoculated into 180 μl LB containing cole. The culture was grown overnight at 30 ° C., 200 rpm, and 85% humidity. 10 μl of each cell culture was then transferred to the wells of a 96 well deep well plate containing 390 mL TB and 30 μg / mL CAM. Deep well plates were incubated for 3 hours at 30 ° C., 250 rpm, and 85% humidity (OD600, 0.6-0.8). Cell cultures were then induced with IPTG at a final concentration of 1 mM and incubated overnight under the same conditions as originally used. The cells were then pelleted using centrifugation at 4000 rpm for 10 minutes. The supernatant was discarded and the pellet was frozen at −80 ° C. before lysis.

(実施例3)
HTP PGAを含有する細胞溶解産物の調製および分析
まず、20mMのトリス−HCl緩衝液、pH7.5、1mg/mLリゾチーム、および0.5mg/mL PMBSを含有する溶解緩衝液250μlを実施例2に記載の通り生成した各ウェル中の細胞ペーストに添加した。細胞を、卓上振盪機で振盪しながら室温で2時間溶解させた。次いで、プレートを4000rpmおよび4℃で15分間遠心分離した。透明な上清を、それらの活性レベルを決定するための生体触媒反応において使用した。
(Example 3)
Preparation and analysis of cell lysate containing HTP PGA First, 250 μl of lysis buffer containing 20 mM Tris-HCl buffer, pH 7.5, 1 mg / mL lysozyme, and 0.5 mg / mL PMBS was added to Example 2. Added to the cell paste in each well produced as described. The cells were lysed for 2 hours at room temperature with shaking on a desktop shaker. The plate was then centrifuged for 15 minutes at 4000 rpm and 4 ° C. Clear supernatants were used in biocatalytic reactions to determine their activity level.

PGA改変体の活性を、インスリンのA1(グリシン)残基、B1(フェニルアラニン)残基、およびB29(リシン)残基に化学的に結合した3つのフェニル酢酸基の除去における改変体の効率に基づいて評価した。HTP反応を96ウェルディープウェルプレート中で行った。まず、反応混合物0.3mlは、0.1Mトリス−HCl、pH8.0、5g/L 3重保護インスリンおよび25〜125μl(線形曲線に応じて)のHTP溶解産物を含有した。HTPプレートをThermotron(登録商標)振盪機(3mm行程、モデル番号AJ185、Infors、30℃、300rpm)中で、6時間または22時間インキュベートした。300μlアセトニトリルを用いて反応をクエンチし、卓上振盪機を使用して3分間混合した。次いでプレートを4000rpmで2分間遠心分離し、分析のためにHPLCにローディングした。Agilent eclipse XDB C18、5μm、2.1×150mmカラムを使用してHTP試料を分析した。流速を毎分0.5mlに設定し、温度を50℃に設定した。移動相Aは、水+0.05%のTFAであり、移動相Bは、アセトニトリル+0.05%のTFAであった。実行時間は7.2分であり、注入の重複が可能であった。勾配は、75%移動相Aで0.2分間、55%移動相Aで4.9分間、5%移動相Aで5.4分間、75%移動相Aに戻して5.9分間であった。   The activity of the PGA variant is based on the efficiency of the variant in removing the three phenylacetate groups chemically bound to the A1 (glycine), B1 (phenylalanine), and B29 (lysine) residues of insulin. And evaluated. The HTP reaction was performed in a 96 well deep well plate. First, 0.3 ml of the reaction mixture contained 0.1 M Tris-HCl, pH 8.0, 5 g / L triple protected insulin and 25-125 μl (depending on the linear curve) HTP lysate. HTP plates were incubated for 6 or 22 hours in a Thermotron® shaker (3 mm stroke, model number AJ185, Infors, 30 ° C., 300 rpm). The reaction was quenched with 300 μl acetonitrile and mixed for 3 minutes using a desktop shaker. The plate was then centrifuged at 4000 rpm for 2 minutes and loaded onto the HPLC for analysis. The HTP samples were analyzed using an Agilent Eclipse XDB C18, 5 μm, 2.1 × 150 mm column. The flow rate was set to 0.5 ml per minute and the temperature was set to 50 ° C. Mobile phase A was water + 0.05% TFA and mobile phase B was acetonitrile + 0.05% TFA. The run time was 7.2 minutes and duplicate injections were possible. The gradient was 0.2 minutes for 75% mobile phase A, 4.9 minutes for 55% mobile phase A, 5.4 minutes for 5% mobile phase A, and 5.9 minutes back to 75% mobile phase A. It was.

(実施例4)
振盪フラスコ(SF)培養物由来の凍結乾燥溶解産物の調製および分析
上記の通り成長させた選択されたHTP培養物を、1%グルコースおよび30μg/ml CAMを伴うLB寒天プレートにプレーティングし、37℃で一晩成長させた。各培養物からの単一コロニーを、1%グルコースおよび30μg/ml CAMを伴うLB 50mlに移した。培養物を30℃、250rpmで18時間成長させ、30μg/ml CAMを含有するTB 250ml中、およそ1:10で継代培養して、最終的なOD600を0.2にした。培養物を30℃、250rpmで135分間成長させてOD600を0.6〜0.8にし、1mM IPTGを用いて誘導した。次いで、培養物を30℃、250rpmで20時間成長させた。培養物を4000rpmで20分間遠心分離した。上清を廃棄し、ペレットを50mMリン酸ナトリウム、pH7.5、30mlに再懸濁させた。細胞をペレット化し(4000rpmで20分間)、−80℃で120分間凍結させた。凍結したペレットを50mMリン酸ナトリウム、pH7.5 30mlに再懸濁させ、Microfluidizerシステム(Microfluidics)を18,000psiで使用して溶解させた。溶解産物をペレット化し(10,000rpmで60分間)、上清を凍結させ、凍結乾燥して振盪フラスコ(SF)酵素を作製した。
Example 4
Preparation and analysis of lyophilized lysates from shake flask (SF) cultures Selected HTP cultures grown as described above were plated on LB agar plates with 1% glucose and 30 μg / ml CAM, 37 Grow overnight at ° C. Single colonies from each culture were transferred to 50 ml LB with 1% glucose and 30 μg / ml CAM. The culture was grown at 30 ° C., 250 rpm for 18 hours and subcultured approximately 1:10 in 250 ml TB containing 30 μg / ml CAM to a final OD 600 of 0.2. Cultures were grown for 135 minutes at 30 ° C., 250 rpm to an OD 600 of 0.6-0.8 and induced with 1 mM IPTG. The culture was then grown at 30 ° C. and 250 rpm for 20 hours. The culture was centrifuged at 4000 rpm for 20 minutes. The supernatant was discarded and the pellet was resuspended in 30 ml of 50 mM sodium phosphate, pH 7.5. Cells were pelleted (4000 rpm for 20 minutes) and frozen at −80 ° C. for 120 minutes. The frozen pellet was resuspended in 30 ml of 50 mM sodium phosphate, pH 7.5 and lysed using a Microfluidizer system (Microfluidics) at 18,000 psi. The lysate was pelleted (60 minutes at 10,000 rpm), the supernatant was frozen and lyophilized to make a shake flask (SF) enzyme.

選択された振盪フラスコPGA改変体の活性を、インスリンのA1(グリシン)残基、B1(フェニルアラニン)残基、およびB29(リシン)残基に化学的に結合した3つのフェニル酢酸基の除去における改変体の効率に基づいて評価した。振盪フラスコ反応を96ウェルディープウェルプレート中で行った。まず、反応混合物0.3mlは、0.1Mトリス−HCl、pH8.0、5g/L 3重保護インスリン、0.1〜0.8g/Lの振盪フラスコ溶解産物を含有した。ディープウェル反応プレートをThermotron(登録商標)振盪機(3mm行程、モデル番号AJ185、Infors)中、30℃、300rpmで、22時間または6時間インキュベートした(ラウンド1進化について22時間およびラウンド2進化について6時間)。アセトニトリル300μlを用いて反応をクエンチし、卓上振盪機で3分間混合した。次いで、プレートを4000rpmで2分間遠心分離し、分析のためにHPLCにローディングした。Agilent eclipse XDB C18、5μm、2.1×150mmカラムを使用してHTP試料を分析した。流速を毎分0.6mlに設定し、温度を50℃に設定した。移動相Aは水+0.05%のTFAであり、移動相Bはアセトニトリル+0.05%のTFAであった。実行時間は18.2分であり、注入の重複が可能であった。勾配は、80%移動相Aで0〜1分間、60%移動相Aで12分間、5%移動相Aで15分間、80%移動相Aに戻して16分間であった。   Altering the activity of selected shake flask PGA variants in the removal of three phenylacetate groups chemically linked to the A1 (glycine), B1 (phenylalanine), and B29 (lysine) residues of insulin Evaluation was based on body efficiency. Shake flask reactions were performed in 96 well deep well plates. First, 0.3 ml of the reaction mixture contained 0.1 M Tris-HCl, pH 8.0, 5 g / L triple protected insulin, 0.1-0.8 g / L shake flask lysate. Deep well reaction plates were incubated for 22 hours or 6 hours at 30 ° C. and 300 rpm in a Thermotron® shaker (3 mm stroke, model number AJ185, Infors) (22 hours for round 1 evolution and 6 for round 2 evolution). time). The reaction was quenched with 300 μl of acetonitrile and mixed for 3 minutes on a desktop shaker. The plate was then centrifuged at 4000 rpm for 2 minutes and loaded onto the HPLC for analysis. The HTP samples were analyzed using an Agilent Eclipse XDB C18, 5 μm, 2.1 × 150 mm column. The flow rate was set to 0.6 ml per minute and the temperature was set to 50 ° C. Mobile phase A was water + 0.05% TFA and mobile phase B was acetonitrile + 0.05% TFA. The run time was 18.2 minutes and duplicate injections were possible. The gradient was 0 to 1 minute with 80% mobile phase A, 12 minutes with 60% mobile phase A, 15 minutes with 5% mobile phase A, and 16 minutes back to 80% mobile phase A.

(実施例5)
ラウンド1進化骨格選択、構築およびスクリーニング
上記の実施例に記載されているHTPプロトコールに従い、実施例4に記載されている振盪フラスコプロトコールを使用してCodex(登録商標)Acylase Panel(Codexis)を評価した。Codex(登録商標)Acylase Panelからの「改変体1」(配列番号4)と称される、改変体のうちの1つにより、0.8g/L振盪フラスコ溶解産物負荷を用いて、22時間で、54%の遊離のインスリンが生成した。改変体1を使用して基質阻害試験を行った(図1を参照のこと)。漸増濃度の3重保護インスリン基質を用いると、改変体1によって触媒される遊離のインスリンの生成は有意に減少した。5時間で、遊離のインスリン生成は、酵素負荷は0.8g/Lに固定で、1g/L基質負荷での82%から10g/L基質負荷での2%まで降下した。本発明は任意の特定の機構に限定されるものではないが、これらの結果により、3重保護インスリン基質の濃度が高いほど基質阻害が引き起こされることが示唆される。遊離のインスリン生成の量は、基質濃度が低いほど増加した(例えば、Wangら、Biopolymer、25巻:S109〜S114頁、[1986年]を参照のこと)。したがって、本発明によって提供される利点の1つは、基質阻害を克服するPGA改変体の生成である。この改変体を第1のラウンド進化のための骨格として選択した。大腸菌PGAを鋳型として改変体1の相同性モデルを構築した(大腸菌PGAは野生型K.citrophila PGAに対して87%配列同一性を有する)。3重保護インスリンを改変体1の活性部位にドッキングして、そのPGAとの相互作用を評価した。次いで、そのアミノ酸配列の96箇所の位置を進化の第1のラウンドのために選択し、これにより活性部位および3重保護インスリン結合性部位の第1の層(5〜6Å内のアミノ酸残基)および第2の層の一部(6〜12Å内のアミノ酸残基)を網羅した。PGAパネルスクリーニング結果およびコンセンサス変異の分析に基づいて、2つのコンビナトリアルライブラリーも設計した。この進化の第1のラウンドにおいて得られた改変体についてのHTPスクリーニングはすべて上記と同じプロトコールを使用し、最終的な反応時点を22時間として行った。改変体1と比較した総活性の対応する改善倍率を有する活性な変異を以下の表5.1に示す。この表では、陽性対照は改変体1(配列番号4)である。
“−”:FIOPC<0.7
“+”:FIOPC=0.7〜1.3
“++”:FIOPC=1.4〜2.0
“+++”:FIOPC≧2.1
(Example 5)
Round 1 Evolutionary Skeleton Selection, Construction and Screening Codex® Aylase Panel (Codexis) was evaluated using the shake flask protocol described in Example 4 according to the HTP protocol described in the above example. . One of the variants, referred to as “variant 1” (SEQ ID NO: 4) from Codex® Aylase Panel, in 22 hours using a 0.8 g / L shake flask lysate load 54% free insulin was produced. A substrate inhibition test was performed using variant 1 (see FIG. 1). With increasing concentrations of the triple protected insulin substrate, the production of free insulin catalyzed by variant 1 was significantly reduced. At 5 hours, free insulin production dropped from 82% at 1 g / L substrate load to 2% at 10 g / L substrate load with the enzyme load fixed at 0.8 g / L. Although the present invention is not limited to any particular mechanism, these results suggest that higher concentrations of the triple protected insulin substrate cause substrate inhibition. The amount of free insulin production increased with lower substrate concentrations (see, eg, Wang et al., Biopolymer, 25: S109-S114, [1986]). Thus, one of the advantages provided by the present invention is the generation of PGA variants that overcome substrate inhibition. This variant was selected as the backbone for the first round evolution. A homology model of variant 1 was constructed using E. coli PGA as a template (E. coli PGA has 87% sequence identity to wild-type K. citrophila PGA). Triple protected insulin was docked to the active site of variant 1 and its interaction with PGA was evaluated. The 96 positions of the amino acid sequence were then selected for the first round of evolution, whereby the first layer of active site and triple protected insulin binding site (amino acid residues within 5-6 Å) And part of the second layer (amino acid residues within 6-12 Å). Two combinatorial libraries were also designed based on PGA panel screening results and analysis of consensus mutations. All HTP screens for variants obtained in the first round of evolution used the same protocol as above, with a final reaction time of 22 hours. The active mutations with the corresponding improvement in total activity compared to variant 1 are shown in Table 5.1 below. In this table, the positive control is variant 1 (SEQ ID NO: 4).
“-”: FIOPC <0.7
“+”: FIOPC = 0.7 to 1.3
“++”: FIOPC = 1.4 to 2.0
“++++”: FIOPC ≧ 2.1

これらの結果に基づいて、改変体6、19、14、67、88、および53を振盪フラスコ体積にスケールアップし、それらの活性を、以前の実施例に記載されているプロトコールを使用して分析した。図2に結果を示す。改変体6では、0.8g/L酵素負荷において22時間で93%の遊離のインスリンが生成し(図2を参照のこと)、改変体1と比較してよりよい発現レベルが達成された。改変体53は改変体1と同様の発現レベルを有したが、改変体1では54%の遊離のインスリンが生成したのと比較して、73%の遊離のインスリンが生成した。結果に基づいて、改変体6(配列番号6)を進化の次のラウンド(すなわち、ラウンド2)の出発骨格として選択した。この改変体を「発現ヒット」とも名付けた。改変体53(配列番号8)も代替ラウンド2骨格として選択し、「活性ヒット」と名付けた。   Based on these results, variants 6, 19, 14, 67, 88, and 53 were scaled up to shake flask volumes and their activity analyzed using the protocol described in the previous examples. did. The results are shown in FIG. Variant 6 produced 93% free insulin in 22 hours at 0.8 g / L enzyme load (see FIG. 2), and a better expression level was achieved compared to variant 1. Variant 53 had the same expression level as variant 1, but variant 1 produced 73% free insulin as compared to 54% free insulin produced. Based on the results, variant 6 (SEQ ID NO: 6) was selected as the starting backbone for the next round of evolution (ie round 2). This variant was also named “expression hit”. Variant 53 (SEQ ID NO: 8) was also selected as an alternative round 2 skeleton and named “activity hit”.

(実施例6)
ラウンド2ライブラリー構築およびスクリーニング
ラウンド1進化から同定された最も有益な変異は、D484N、V264A、Q547K、V56I、S750G、V56L、S619K、V28N、V618I、およびT131Nであった。第1のラウンド結果の分析に基づき、改変体6および改変体53の両方を骨格として使用して2つのコンビナトリアルライブラリーを設計した。ラウンド2改変体に対して使用したHTPスクリーニング方法はすべて以前に記載されたプロトコールを使用し、最終的な反応時点を6時間として行った。改変体6および改変体53と比較して総活性の対応する改善倍率を有する活性な変異を以下の表6.1および6.2に示す。表6.1は、改変体6に基づく改変体についての結果を提供し、表6.2は、改変体53に基づく改変体についての結果を提供する。
“−”:FIOPC<0.7
“++”:FIOPC=0.7〜1.3
“++”:FIOPC=1.4〜2.0
“+++”:FIOPC≧2.1
“−”:FIOPC<0.7
“++”:FIOPC=0.7〜1.3
“++”:FIOPC=1.4〜2.0
“+++”:FIOPC≧2.1
(Example 6)
Round 2 library construction and screening The most beneficial mutations identified from Round 1 evolution were D484N, V264A, Q547K, V56I, S750G, V56L, S619K, V28N, V618I, and T131N. Based on the analysis of the first round results, two combinatorial libraries were designed using both variant 6 and variant 53 as scaffolds. All HTP screening methods used for round 2 variants used the protocol previously described, with a final reaction time of 6 hours. Active mutations with a corresponding improvement in total activity compared to variant 6 and variant 53 are shown in Tables 6.1 and 6.2 below. Table 6.1 provides results for variants based on variant 6, and Table 6.2 provides results for variants based on variant 53.
“-”: FIOPC <0.7
“++”: FIOPC = 0.7 to 1.3
“++”: FIOPC = 1.4 to 2.0
“++++”: FIOPC ≧ 2.1
“-”: FIOPC <0.7
“++”: FIOPC = 0.7 to 1.3
“++”: FIOPC = 1.4 to 2.0
“++++”: FIOPC ≧ 2.1

改変体6(配列番号6)、258(配列番号12)および261(配列番号10)を振盪フラスコにスケールアップし、それらの活性を、以前の実施例に記載されているプロトコールを使用して分析した。図3に結果を示す。示されている通り、改変体258では、<0.8g/L振盪フラスコ溶解産物負荷において6時間で>99%の遊離のインスリンが生成し、それにより、基質阻害が完全に解除され、一方、改変体261では、0.8g/L溶解産物負荷において6時間で約90%の遊離のインスリンが生成した。   Variants 6 (SEQ ID NO: 6), 258 (SEQ ID NO: 12) and 261 (SEQ ID NO: 10) are scaled up in shake flasks and their activity is analyzed using the protocol described in the previous examples. did. The results are shown in FIG. As shown, variant 258 produced> 99% free insulin in 6 hours at <0.8 g / L shake flask lysate load, thereby completely releasing substrate inhibition, while Variant 261 produced approximately 90% free insulin in 6 hours at 0.8 g / L lysate loading.

したがって、本発明は、総活性の8倍の改善を有するPGA改変体を提供する。S619K置換は活性に大きく影響し、D484N置換は発現に主に影響することも決定された。S619Kはインスリン結合性部位の第1の層に位置し、D484Nは活性部位の第2の層に位置する。   Thus, the present invention provides PGA variants that have an 8-fold improvement in total activity. It was also determined that the S619K substitution has a significant effect on activity and that the D484N substitution has a major effect on expression. S619K is located in the first layer of the insulin binding site and D484N is located in the second layer of the active site.

(実施例7)
DMSO耐性
改善されたPGA改変体(改変体番号6、258、および261)に対してDMSO耐性試験を行った。実施例4に記載されているプロトコールに従い、0〜50%v/v DMSOの存在下で反応を行った。結果(図4を参照のこと)は、試験したすべての改変体が、試験反応物にDMSOを添加すると活性を失うことが示される。例えば、30%v/v DMSOでは、改変体258により生成した遊離のインスリンはたった30%であった。
(Example 7)
DMSO resistance DMSO resistance testing was performed on the improved PGA variants (variant numbers 6, 258, and 261). The reaction was performed in the presence of 0-50% v / v DMSO according to the protocol described in Example 4. The results (see Figure 4) show that all variants tested lose activity when DMSO is added to the test reaction. For example, at 30% v / v DMSO, only 30% of free insulin was produced by variant 258.

本出願で引用されているすべての刊行物、特許、特許出願および他の文献は、個々の各刊行物、特許、特許出願または他の文献が、すべての目的ために参照により組み込まれると個々に示されているのと同程度に、すべての目的のためにその全体が参照により本明細書に組み込まれる。   All publications, patents, patent applications, and other references cited in this application are individually incorporated by reference as individual individual publications, patents, patent applications, or other references are incorporated by reference for all purposes. To the same extent as shown, it is incorporated herein by reference in its entirety for all purposes.

様々な特定の実施形態を例証および説明したが、本発明の精神および範囲から逸脱することなく様々な変更を行うことができると認識されよう。   While various specific embodiments have been illustrated and described, it will be appreciated that various changes can be made without departing from the spirit and scope of the invention.

Claims (10)

インスリンからA1/B1/B29トリフェニル酢酸保護基を除去して遊離のインスリンを生成することができる操作されたペニシリンGアシラーゼであって、前記操作されたペニシリンGアシラーゼは、配列番号2、4、6、8、10、および/または12と少なくとも85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれを超えて同一である、ペニシリンGアシラーゼ。   An engineered penicillin G acylase capable of removing A1 / B1 / B29 triphenylacetic acid protecting group from insulin to produce free insulin, wherein the engineered penicillin G acylase is SEQ ID NO: 2, 4, At least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more identical to 6, 8, 10, and / or 12 Penicillin G acylase. 表5.1、表6.2、および/または表6.3において提供される変異を少なくとも1つ含む、請求項1に記載の操作されたペニシリンGアシラーゼ。   The engineered penicillin G acylase of claim 1, comprising at least one mutation provided in Table 5.1, Table 6.2, and / or Table 6.3. 配列番号4、6、8、10、または12を含む、請求項1に記載の操作されたペニシリンGアシラーゼ。   2. The engineered penicillin G acylase of claim 1, comprising SEQ ID NO: 4, 6, 8, 10, or 12. 配列番号3、5、7、9、および11から選択されるポリヌクレオチド配列によってコードされる、請求項1に記載の操作されたペニシリンGアシラーゼ。   2. The engineered penicillin G acylase of claim 1, encoded by a polynucleotide sequence selected from SEQ ID NOs: 3, 5, 7, 9, and 11. 請求項4に記載のポリヌクレオチド配列を含むベクター。   A vector comprising the polynucleotide sequence of claim 4. 請求項5に記載のベクターを含む宿主細胞。   A host cell comprising the vector of claim 5. 遊離のインスリンを生成するための方法であって、i)請求項1に記載の操作されたペニシリンGアシラーゼ、およびA1/B1/B29トリフェニル酢酸保護基を含むインスリンを提供すること、ならびにii)前記操作されたペニシリンGアシラーゼによりA1/B1/B29トリフェニル酢酸保護基が除去され、遊離のインスリンが生成する条件下で、前記操作されたペニシリンGアシラーゼを、前記A1/B1/B29トリフェニル酢酸保護基を含むインスリンに曝露することを含む、方法。   A method for producing free insulin, comprising: i) providing an engineered penicillin G acylase according to claim 1 and an A1 / B1 / B29 triphenylacetic acid protecting group, and ii) Under the conditions that the A1 / B1 / B29 triphenylacetic acid protecting group is removed by the engineered penicillin G acylase and free insulin is produced, the engineered penicillin G acylase is converted to the A1 / B1 / B29 triphenylacetic acid. Exposing to insulin comprising a protecting group. 前記操作されたペニシリンGアシラーゼが、90%超、91%超、92%超、93%超、94%超、95%超、96%超、97%超、98%超、99%超またはそれを超える遊離のインスリンを生成する、請求項7に記載の方法。   The engineered penicillin G acylase is greater than 90%, greater than 91%, greater than 92%, greater than 93%, greater than 94%, greater than 95%, greater than 96%, greater than 97%, greater than 98%, greater than 99% or more 8. The method of claim 7, wherein more than free insulin is produced. 前記ペニシリンGアシラーゼが、配列番号4、6、8、10、または12を含む、請求項7および/または8に記載の方法。   9. The method of claim 7 and / or 8, wherein the penicillin G acylase comprises SEQ ID NO: 4, 6, 8, 10, or 12. 請求項7〜9のいずれかに記載の方法に従って生成した遊離のインスリンを含む組成物。

A composition comprising free insulin produced according to the method of any of claims 7-9.

JP2017557457A 2015-05-07 2016-05-06 Penicillin G acylase Active JP6755886B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562158118P 2015-05-07 2015-05-07
US62/158,118 2015-05-07
PCT/US2016/031132 WO2016179464A1 (en) 2015-05-07 2016-05-06 Penicillin-g acylases

Publications (3)

Publication Number Publication Date
JP2018515089A true JP2018515089A (en) 2018-06-14
JP2018515089A5 JP2018515089A5 (en) 2019-04-11
JP6755886B2 JP6755886B2 (en) 2020-09-16

Family

ID=57218075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017557457A Active JP6755886B2 (en) 2015-05-07 2016-05-06 Penicillin G acylase

Country Status (14)

Country Link
US (5) US9944916B2 (en)
EP (1) EP3292136B1 (en)
JP (1) JP6755886B2 (en)
KR (1) KR102604503B1 (en)
CN (1) CN107531762A (en)
AU (1) AU2016258091B2 (en)
CA (1) CA2983620A1 (en)
DK (1) DK3292136T3 (en)
HU (1) HUE053863T2 (en)
IL (1) IL255245B (en)
MX (1) MX2017014213A (en)
NZ (1) NZ736220A (en)
SG (1) SG11201708356PA (en)
WO (1) WO2016179464A1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102604503B1 (en) 2015-05-07 2023-11-20 코덱시스, 인코포레이티드 Penicillin-G acylase
WO2017193022A1 (en) 2016-05-05 2017-11-09 Codexis, Inc. Penicillin-g acylases
EP3565893A4 (en) * 2017-01-05 2020-12-09 Codexis, Inc. Penicillin-g acylases
CN111051506B (en) * 2017-06-27 2023-11-24 科德克希思公司 Penicillin G acylase
KR101985911B1 (en) * 2017-12-28 2019-06-04 아미코젠주식회사 Mutants of penicillin G acylase from Achromobacter sp. CCM 4824, and uses thereof
CN109207466B (en) * 2018-11-08 2021-01-08 山东鲁抗医药股份有限公司 Immobilization method of penicillin acylase and immobilized enzyme
KR102363768B1 (en) * 2019-11-15 2022-02-16 아미코젠주식회사 Mutants of penicillin G acylase with increased production of cefazolin, and uses thereof

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US603344A (en) 1898-05-03 Trough for well-curbs
CA1338400C (en) 1983-08-31 1996-06-18 David H. Gelfand Recombinant fungal cellulases
US6869930B1 (en) 1993-09-17 2005-03-22 Novo Nordisk A/S Acylated insulin
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6995017B1 (en) 1994-02-17 2006-02-07 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6165793A (en) 1996-03-25 2000-12-26 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6309883B1 (en) 1994-02-17 2001-10-30 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5928905A (en) 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
ATE206460T1 (en) 1994-06-03 2001-10-15 Novo Nordisk Biotech Inc PURIFIED MYCELIOPTHHORA LACCASES AND NUCLEIC ACIDS CODING THEREOF
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
WO1996005318A1 (en) 1994-08-12 1996-02-22 Gist-Brocades B.V. Mutated penicillin g acylase genes
FI104465B (en) 1995-06-14 2000-02-15 Valio Oy Protein hydrolyzates for the treatment and prevention of allergies and their preparation and use
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6506602B1 (en) 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
JP4062366B2 (en) 1997-01-17 2008-03-19 マキシジェン,インコーポレイテッド Evolution of whole cells and organisms by recursive sequence recombination
US7148054B2 (en) 1997-01-17 2006-12-12 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6365408B1 (en) 1998-06-19 2002-04-02 Maxygen, Inc. Methods of evolving a polynucleotides by mutagenesis and recombination
EA005682B1 (en) 1998-10-06 2005-04-28 Марк Аарон Эмалфарб Transformed fungal strain of the genius chrysosporium
JP4221100B2 (en) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 Semiconductor device
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
EP1072010B1 (en) 1999-01-19 2010-04-21 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
AU3391900A (en) 1999-03-05 2000-09-21 Maxygen, Inc. Encryption of traits using split gene sequences
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6519065B1 (en) 1999-11-05 2003-02-11 Jds Fitel Inc. Chromatic dispersion compensation device
WO2001075767A2 (en) 2000-03-30 2001-10-11 Maxygen, Inc. In silico cross-over site selection
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
DK2278509T3 (en) 2002-03-01 2014-12-15 Codexis Mayflower Holdings Llc Methods, systems and software for identification of functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
WO2003078583A2 (en) 2002-03-09 2003-09-25 Maxygen, Inc. Optimization of crossover points for directed evolution
SI1648933T1 (en) 2003-07-25 2010-01-29 Conjuchem Biotechnologies Inc Long lasting insulin derivatives and methods thereof
JP2007502124A (en) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド Improved ketoreductase polypeptides and related polynucleotides
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
HUE041367T2 (en) 2008-06-13 2019-05-28 Codexis Inc Method of synthesizing polynucleotide variants
WO2010054319A2 (en) * 2008-11-10 2010-05-14 Codexis, Inc. Penicillin-g acylases
NO2367940T3 (en) * 2008-12-23 2018-04-21
CN103074320B (en) * 2012-05-25 2018-06-08 石药集团中奇制药技术(石家庄)有限公司 Penicillin G acylase containing one or several point mutation
KR102604503B1 (en) 2015-05-07 2023-11-20 코덱시스, 인코포레이티드 Penicillin-G acylase

Also Published As

Publication number Publication date
DK3292136T3 (en) 2021-03-22
EP3292136A4 (en) 2019-04-10
US20160326508A1 (en) 2016-11-10
US20220042004A1 (en) 2022-02-10
JP6755886B2 (en) 2020-09-16
US20190345474A1 (en) 2019-11-14
AU2016258091A1 (en) 2017-11-02
CN107531762A (en) 2018-01-02
HUE053863T2 (en) 2021-07-28
US11180747B2 (en) 2021-11-23
CA2983620A1 (en) 2016-11-10
IL255245B (en) 2020-03-31
SG11201708356PA (en) 2017-11-29
EP3292136A1 (en) 2018-03-14
NZ736220A (en) 2024-03-22
KR20180004169A (en) 2018-01-10
AU2016258091B2 (en) 2020-10-01
US10781436B2 (en) 2020-09-22
US10400231B2 (en) 2019-09-03
IL255245A0 (en) 2017-12-31
US20180201919A1 (en) 2018-07-19
MX2017014213A (en) 2018-03-28
US20200385699A1 (en) 2020-12-10
US9944916B2 (en) 2018-04-17
KR102604503B1 (en) 2023-11-20
EP3292136B1 (en) 2021-02-17
WO2016179464A1 (en) 2016-11-10

Similar Documents

Publication Publication Date Title
US11180747B2 (en) Variant penicillin-G acylases
US20230227805A1 (en) Penicillin-g acylases
US11965192B2 (en) Penicillin-G acylases
US20230272363A1 (en) Penicillin-g acylases

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190301

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200826

R150 Certificate of patent or registration of utility model

Ref document number: 6755886

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250