JP2008503589A - 機能的生体分子を同定するための方法、システムおよびソフトウェア - Google Patents
機能的生体分子を同定するための方法、システムおよびソフトウェア Download PDFInfo
- Publication number
- JP2008503589A JP2008503589A JP2007518248A JP2007518248A JP2008503589A JP 2008503589 A JP2008503589 A JP 2008503589A JP 2007518248 A JP2007518248 A JP 2007518248A JP 2007518248 A JP2007518248 A JP 2007518248A JP 2008503589 A JP2008503589 A JP 2008503589A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- activity
- model
- code
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- General Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Hematology (AREA)
- Immunology (AREA)
- Urology & Nephrology (AREA)
- Plant Pathology (AREA)
- Ecology (AREA)
Abstract
Description
本願は、2003年7月29日に出願され、発明者としてGustafssonらを指定し、そして「Methods,Systems,and Software for Identifying Functional Bio−Molecules」という名称の、米国特許出願第10/629,351号の一部継続出願である。この米国特許出願第10/629,351号は、2003年3月3日に出願され、発明者としてGustafssonらを指定し、そして「Methods,Systems,and Software for Identifying Functional Bio−Molecules」という名称の、米国特許出願第10/379,378号の一部継続出願である。米国特許出願第10/379,378号は、米国特許法第119(e)条の下で、2002年3月1日に出願された米国仮特許出願第60/360,982号からの優先権を主張する。これらの文書の各々は、その全体が、全ての目的に対して、本明細書中に参考として援用される。
本発明は、分子生物学、分子進化、バイオインフォマティクスおよびデジタルシステムの分野に関する。さらに詳細には、本発明は、生体分子の活性をコンピューターで予測するための方法に関する。デジタルシステムを含むシステム、およびこれらの方法を行うためのシステム・ソフトウェアも提供される。本発明の方法は、産業的な用途および治療用途のためのタンパク質の最適化において有用性を有する。
本発明は、非線形項、詳細には、この配列における2つ以上の残基の間の相互作用を説明する項を使用するモデルを生成し、そして用いるための技術を提供する。これらの非線形項は、相互作用に関係する残基の存在(または非存在)を各々が示す、2つ以上の変数の乗算を含む「外積(cross product)」項であってもよい。ある実施形態では、本発明は、配列の活性を最も良好に記載する非線形項を選択するための技術に関する。残基の間に真の相互作用があるよりも、しばしばはるかに多い潜在的な非線形相互作用項が存在することに注目のこと。従って、オーバーフィッティング(overfitting)を回避するために、限られた数の非線形のみが代表的には使用されて、使用されるものは活性に影響する相互作用を反映するはずである。
(I.定義)
本発明を詳細に記載する前に、本発明は、当然ながら変化し得る、特定の配列、組成物、アルゴリズムまたはシステムに限定されないことが理解されるべきである。本明細書に用いられる専門用語は、特定の実施形態を記載する目的にのみ用いられ、限定を意図するものではないこともまた理解されるべきである。本明細書および添付の特許請求の範囲に用いられる場合、単数形「1つの、ある(a、an)」、および「この、その(the)」は、内容および文脈が明確に他を示すのでない限り、複数の言及を包含する。従って、例えば、「あるデバイス、1つのデバイス(a device)」という言及は、このようなデバイスの2つ以上の組み合わせなどを包含する。他に示さない限り、「または(or)」の接続詞はブール論理演算子(Boolean logical operator)として正確な意味で用いられるものとし、選択肢における特徴の選択(AまたはB、ここでAの選択はBと相互排他的である)および接続詞における特徴の選択(AまたはB、ここでAおよびBの両方が選択される)の両方を包含する。
本発明によれば、タンパク質配列および活性スペースを探索するために用いられ得る新規なタンパク質改変ライブラリを生成するための種々の方法が提供される。多くのこのような方法の特徴は、所望の活性に影響を与えることが予測されるタンパク質配列においてアミノ酸残基を同定するための手順である。1例として、このような手順は以下の操作を包含する:
(a)タンパク質改変体のトレーニングセットを特徴付けるデータを受容する工程であって、このデータがこのトレーニングセットにおける各々のタンパク質改変体についての活性および配列情報を提供する工程と;
(b)このデータから、アミノ酸残基タイプの関数として活性を予測する配列活性モデルを構築する工程、およびこの配列における位置に対応させる工程(好ましくは、このモデルは、1つ以上の非線形項を含み、各々が2つ以上のアミノ酸残基の間の相互作用を示す)と;
(c)この配列活性モデルを用いて、所望の活性に影響を与えるように変化されるべき1つ以上のタンパク質改変体において特定の位置で1つ以上のアミノ酸残基を同定する工程。
タンパク質改変体ライブラリとは、ライブラリにおいてメンバー間で異なる1つ以上の残基を有する複数のタンパク質の群である。それらは、本発明の方法によって生成され得る。それらは、本発明に従う配列活性モデルを生成するために用いられるトレーニングセットのためのデータを提供し得る。タンパク質改変体ライブラリに含まれるタンパク質の数は、適用およびコストに依存する。
1)前に記載された原理(親の配列における存在、保存のレベル、など)に基づいて切り替えるための位置を同定する;
2)要因の数(可変位置)、レベルの数(各々の位置での選択)、および行う実験の数を規定することによって、市販の統計学的に利用可能なパッケージの1つを用いるDOE実験を作成する。出力マトリクスの情報内容(代表的には、各々の位置での残基選択に相当する1sおよび0sからなる)は、行われる実験の数(多いほどよい)に直接依存する;
3)出力マトリクスを用いて、各々の位置での特定の残基選択に対する1sおよび0sの戻りをコードするタンパク質アラインメントを構築する;
4)タンパク質アラインメントに示されるタンパク質をコードする遺伝子を合成する;
5)関連のアッセイ(単数または複数)において、合成遺伝子によってコードされるタンパク質を試験する;
6)試験された遺伝子/タンパク質に対するモデルを構築する;
7)前に記載された工程に従って、重要な位置を同定し、そして改善された適合度を有する引き続くライブラリを構築する。
上記のとおり、本発明で用いられる配列活性モデルは、タンパク質配列情報をタンパク質活性に対して関係させる。このモデルによって用いられるこのタンパク質配列情報は、多くの形態を利用する。高頻度に、これは、タンパク質中のアミノ酸残基の完全な配列、例えば、HGPVFSTGGA....である。しかし、ある場合には、完全なアミノ酸配列を提供することは必要ではないかもしれない。例えば、特定の研究労力において変化されるべき残基のみを提供するだけで十分であるかもしれない。例えば、研究の後期段階では、多くの残基を固定してもよいし、配列スペースの限られた領域のみが探索され続けてもよい。このような状況では、探索を続けるタンパク質の領域における残基の同定のみを入力として要する、配列活性モデルを提供することが便利であり得る。さらに、いくつかのモデルは、この残基位置で残基の正確な同定は必要としないかもしれないが、代わりに、特定の残基位置でアミノ酸を特徴付ける1つ以上の物理的または化学的な特性を同定し得る。例えば、このモデルは、バルク、疎水性、酸性度などによって残基位置の同定を要し得る。いくつかのモデルでは、このような特性の組み合わせが使用される。
本発明は、非線形モデルに関するが、これらは、活性に対する配列の線形モデルの文脈ではさらに容易に理解され得る。従って、線形モデルの形態および開発をここに記載する。一般には、活性対配列の線形回帰モデルは以下の式を有する:
非線形モデリングを使用して、タンパク質中の活性に寄与する残基間の相互作用を説明する。N−Kのランドスケープはこのタンパク質を描写する。パラメーターNは、関連のポリペプチド配列のコレクションにおける可変残基の数をいう。パラメーターKは、これらのポリペプチドのいずれかの中の個々の残基の間の相互作用を示す。相互作用は通常は、ポリペプチドの一次構造、二次構造または三次構造のいずれかにおける種々の残基の間の緊密な物理的近接の結果である。相互作用は、直接相互作用、間接相互作用、物理化学相互作用、折り畳み中間体に起因する相互作用、翻訳効果などに起因し得る。
単独の最高に予測されたタンパク質を簡単に合成するのではなく、各々の位置で残基選択における変化に対して最高のタンパク質の鋭敏な分析に基づいて、タンパク質のコンビナトリアルライブラリを生成し得る。所定の残基選択が、予測されたタンパク質について鋭敏であるほど、その予測された適合度変化は大きくなる。当業者は、これらの感度を最高から最低にランク付けし得、そして感度スコアを用いて、感受性に基づいてこれらの残基を取り込むことによって、引き続く回においてコンビナトリアルタンパク質ライブラリを作製する。線形モデルについては、感度は、このモデルにおける所定の残基項に関連する係数のサイズを単純に考慮することによって同定され得る。非線形モデルでは、これは、不可能である。代わりに、残基感度は、単独の残基が「ベスト」予測配列で変化される場合、活性における変化を算出するためのモデルを用いることによって決定され得る。
上記のアプローチに対する複数の他のバリエーションは、本発明の範囲内である。1例として、xij変数は、アミノ酸の物理的特性または化学的特性の提示であり、アミノ酸自体の正確な同一性ではない(ロイシン対バリン対プロリン、...)。このような特性の例としては、親油性、バルクおよび電気的特性(例えば、形式電荷、ファン・デル・ワールス表面積関連部分電荷など)が挙げられる。このアプローチを実行するために、アミノ酸残基に相当するxij値は、この特性から構築されたそれらの特性または主成分に関して呈示され得る。
ベクトル1=a1(残基位置1)+a2(残基位置2)+a3(残基位置3)
明らかであるはずなように、本発明の実施形態は、1つ以上のコンピューターシステムに記憶されるか、またはそれを通じて移動される命令および/またはデータの制御下で作用するプロセスを使用する。本発明の実施形態はまた、これらの作業を行うための装置に関する。このような装置は、特別に設計されてもよいし、そして/または必要な目的のために構築されてもよく、あるいはコンピュータープログラムおよび/またはそのコンピューターに記憶されたデータ構造によって選択的に活性化されるかまたは再構成された一般的な目的のコンピューターであってもよい。本明細書に呈示されるプロセスは、いかなる特定のコンピューターにも他の装置にも本質的に関連しない。詳細には、種々の一般的目的の機械は、本明細書の教示に従って記載されるプログラムとともに用いられ得る。しかし、いくつかの場合には、必要な方法操作を行うための専門的な装置を構築することがさらに好都合であり得る。種々のこれらの機械についての特定の構造は、以下に示される説明から明らかである。
前述の発明は、明確さおよび理解の目的のためにある程度詳細に記載されてきたが、形式および詳細における種々の変化が、本発明の真の範囲から逸脱することなくなされ得ることがこの開示を読めば当業者には明らかである。例えば、上記の全ての技術および装置は、種々の組み合わせで用いられ得る。本出願に引用される全ての刊行物、特許、特許出願、または他の文献は、あたかも各々の個々の刊行物、特許、特許出願または他の文献が全ての目的のために参照によって援用されると個々に示されるかのように、同じ程度まで全ての目的のためにその全体が参照によって援用される。
Claims (54)
- 所望の活性に影響するためのタンパク質改変体ライブラリにおけるバリエーションについてアミノ酸残基を同定するための方法であって、
(a)タンパク質改変体ライブラリのトレーニングセットを特徴付けるデータを受容する工程であって、該データが該トレーニングセットにおける各々のタンパク質改変体についての活性および配列の情報を提供する工程と;
(b)該データから、アミノ酸残基タイプの関数として活性を予測する配列活性モデルを構築する工程、およびあるタンパク質配列における位置に対応させる工程であって、
該配列活性モデルが、1つ以上の非線形項を含み、各々が該タンパク質配列における2つ以上のアミノ酸残基の間の相互作用を示す工程と;
(c)所望の活性に影響を与えるバリエーションについて特定の位置で1つ以上のアミノ酸残基を同定するために該配列活性モデルを用いる工程と;
を包含する、方法。 - 前記非線形項の少なくとも1つが外積項であり、該外積項が1つの相互作用する残基の存在を示す1つの変数と、別の相互作用する残基の存在を示す別の変数との積を含む、請求項1に記載の方法。
- 前記配列活性モデルが、前記少なくとも1つの外積項および1つ以上の線形項の合計を含み、各々が前記トレーニングセットにおける可変残基の存在を示す、請求項2に記載の方法。
- 前記配列活性モデルを構築する工程が、可能性がある外積項の群から1つ以上の外積項を選択する工程を包含する、請求項2に記載の方法。
- 前記1つ以上の外積項を選択する工程が、種々の外積項を使用する種々のモデルの予測能力に基づいて外積項を選択する遺伝的アルゴリズムを実行する工程を包含する、請求項4に記載の方法。
- 前記タンパク質可変体ライブラリにおけるタンパク質改変体が、系統的に改変された配列を有する、請求項1に記載の方法。
- 系統的に改変された配列を同定するためにDOEを行なう工程をさらに包含する、請求項6に記載の方法。
- さらに、
(d)前記配列活性モデルを用いて、新規なタンパク質改変体ライブラリに固定されたままである1つ以上のアミノ酸残基を同定する工程、
を包含する、請求項1に記載の方法。 - 前記タンパク質改変体ライブラリが、天然に存在するタンパク質またはそれから誘導されるタンパク質を含む、請求項1に記載の方法。
- 前記天然に存在するタンパク質が、単一の遺伝子ファミリーのメンバーによってコードされるタンパク質を含む、請求項9に記載の方法。
- 前記タンパク質改変体ライブラリが、組み換えに基づく多様性生成機構を用いることによって得られるタンパク質を含む、請求項1に記載の方法。
- 前記配列活性モデルが回帰モデルである、請求項1に記載の方法。
- 前記配列活性モデルを用いて1つ以上のアミノ酸残基を同定する工程が、組み換えに基づく多様性生成機構における使用のための配列を同定する工程をさらに包含し、該配列が(c)において同定される1つ以上のアミノ酸残基においてバリエーションを含む、請求項1に記載の方法。
- 前記配列活性モデルを用いる工程が、所望の活性の最高値を有することが該モデルによって予測される配列を同定する工程を包含する、請求項1に記載の方法。
- 前記配列活性モデルを用いて1つ以上のアミノ酸残基を同定する工程が、該配列活性モデルを用いて所望の活性に対する影響順で残基位置をランク付けする工程を包含する、請求項1に記載の方法。
- 前記モデルを用いる工程が、遺伝的アルゴリズムにおいて適合度関数としてモデルを用いる工程を包含する、請求項1に記載の方法。
- 前記遺伝的アルゴリズムを使用して、前記所望の活性の最高値を有することがモデルによって予測される配列を選択する、請求項16に記載の方法。
- 前記配列活性モデルを用いて、特定の位置で1つ以上のアミノ酸残基を同定する工程が、新規なタンパク質改変体ライブラリを生成するのにおける使用のための1つ以上の配列を同定する工程を包含する、請求項1に記載の方法。
- 新規なタンパク質改変体ライブラリを生成するのにおける使用のための前記1つ以上の配列が、1つ以上の同定されたアミノ酸残基のバリエーションをコードするオリゴヌクレオチド配列である、請求項18に記載の方法。
- 前記オリゴヌクレオチド配列が、(i)天然に存在する親のタンパク質のなかで最高の活性を有する天然に存在する親タンパク質、または(ii)該最高の活性を有することが前記配列活性モデルによって予測される配列、のうちの少なくとも一部をコードする、請求項19に記載の方法。
- 新規なタンパク質改変体ライブラリを特徴付ける活性および配列データを用いて新規な配列活性モデルを構築する工程をさらに包含する、請求項18に記載の方法。
- 前記(c)において同定される1つ以上のアミノ酸残基が、前記活性モデル用いて予測される参照配列、または前記タンパク質改変体ライブラリのメンバーを記述する参照配列において同定される、請求項1に記載の方法。
- タンパク質改変体ライブラリの前記トレーニングセットが、DNA断片化媒介性組み換えまたは合成オリゴヌクレオチド媒介性組み換えを、1つ以上の天然に存在する親タンパク質の全てまたは一部をコードする核酸上で行うことによって得られたタンパク質を含む、請求項1に記載の方法。
- プログラム命令が与えられる機械読み取り可能な媒体を備えるコンピュータープログラム製品であって、該プログラム命令は、所望の活性に影響するタンパク質改変体ライブラリにおけるバリエーションについてアミノ酸残基を同定するためのものであって、該命令が、
(a)タンパク質改変体ライブラリのトレーニングセットを特徴付けるデータを受容するためのコードであって、
該データが該トレーニングセットにおける各々のタンパク質改変体についての活性および配列の情報を提供するコードと;
(b)該データから、アミノ酸残基タイプの関数として活性を予測する配列活性モデルを構築し、あるタンパク質配列における位置に対応させるためのコードであって、
該配列活性モデルが1つ以上の非線形項を含み、各々が該タンパク質配列中の2つ以上のアミノ酸残基の間の相互作用を示すコードと;
(c)該配列活性モデルを用いて、所望の活性に影響を与えるバリエーションについて特定の位置で1つ以上のアミノ酸残基を同定するためのコードと、
を備える、コンピュータープログラム製品。 - 非線形項の少なくとも1つが外積項であって、1つの相互作用する残基の存在を示す1つの変数と、別の相互作用する残基の存在を示す別の変数との積を含む、外積項である、請求項24に記載のコンピュータープログラム製品。
- 前記配列活性モデルが、前記少なくとも1つの外積項および1つ以上の線形項の合計を含み、各々が前記トレーニングセットにおける可変残基の存在を示す、請求項25に記載のコンピュータープログラム製品。
- 前記配列活性モデルを構築するための前記コードが、可能性がある外積項の群から1つ以上の外積項を選択するためのコードを含む、請求項25に記載のコンピュータープログラム製品。
- 前記1つ以上の外積項を選択するためのコードが、異なる外積項を使用する種々のモデルの予測能力に基づいて外積項を選択する遺伝的アルゴリズムを実行する工程を包含する、請求項27に記載のコンピュータープログラム製品。
- さらに、
(d)前記配列活性モデルを用いて、新規なタンパク質改変体ライブラリに固定されたままである1つ以上のアミノ酸残基を同定するためのコード、
を包含する、請求項24に記載のコンピュータープログラム製品。 - 前記配列活性モデルが回帰モデルである、請求項24に記載のコンピュータープログラム製品。
- 前記配列活性モデルを用いて1つ以上のアミノ酸残基を同定するためのコードが、組み換えに基づく多様性生成機構における使用のための配列を同定するためのコードをさらに包含し、該配列が(c)において同定される1つ以上のアミノ酸残基においてバリエーションを含む、請求項24に記載のコンピュータープログラム製品。
- 前記配列活性モデルを用いるためのコードが、所望の活性の最高値を有することがモデルによって予測される配列を同定するためのコードを包含する、請求項24に記載のコンピュータープログラム製品。
- 前記配列活性モデルを用いて1つ以上のアミノ酸残基を同定するためのコードが、該配列活性モデルを用いて所望の活性に対する影響順で残基位置をランク付けするためのコードを包含する、請求項24に記載のコンピュータープログラム製品。
- 前記モデルを用いるためのコードが、遺伝的アルゴリズムにおいて適合度関数としてモデルを用いるためのコードを包含する、請求項24に記載のコンピュータープログラム製品。
- 前記遺伝的アルゴリズムを使用して、前記所望の活性の最高値を有することがモデルによって予測される配列を選択する、請求項34に記載の方法。
- 前記配列活性モデルを用いて、特定の位置で1つ以上のアミノ酸残基を同定するためのコードが、新規なタンパク質改変体ライブラリを生成するのにおける使用のための1つ以上の配列を同定するためのコードを包含する、請求項24に記載のコンピュータープログラム。
- 新規なタンパク質改変体ライブラリを生成するのにおける使用のための前記1つ以上の配列が、1つ以上の同定されたアミノ酸残基のバリエーションをコードするオリゴヌクレオチド配列である、請求項36に記載のコンピュータープログラム製品。
- 新規なタンパク質改変体ライブラリを特徴付ける活性および配列データを用いて新規な配列活性モデルを構築するためのコードをさらに包含する、請求項36に記載のコンピュータープログラム製品。
- 新規なタンパク質改変体ライブラリの1つ以上のメンバーを生成のために選択するためのコードをさらに包含する、請求項36に記載のコンピュータープログラム製品。
- 前記(c)において前記コードによって同定される1つ以上のアミノ酸残基が、前記活性モデル用いて予測される参照配列、または前記タンパク質改変体ライブラリのメンバーを記述する参照配列において同定される、請求項24に記載のコンピュータープログラム製品。
- 所望の活性に影響するためにタンパク質改変体ライブラリをコードする核酸におけるバリエーションについてヌクレオチドを同定するための方法であって、該方法が、
(a)タンパク質改変体ライブラリのトレーニングセットを特徴付けるデータを受容する工程であって、該データが該トレーニングセットにおける各々のタンパク質改変体についての活性およびヌクレオチド配列の情報を提供する工程と;
(b)該データから、ヌクレオチドタイプの関数として活性を予測する配列活性モデルを構築する工程、および該ヌクレオチド配列における位置に対応させる工程であって、
該配列活性モデルが1つ以上の非線形項を含み、各々がタンパク質配列中の2つ以上のアミノ酸残基の間の相互作用を示す工程と;
(c)該配列活性モデルを用いて、所望の活性に対する影響順で該ヌクレオチド配列中の特定の位置でヌクレオチド配列中の位置および/またはヌクレオチドのタイプをランク付けする工程と、
(d)該ランク付けを用いて、所望の活性に影響を与えるために改変または固定されるべきヌクレオチド配列において、1つ以上のヌクレオチドを同定する工程と、
を包含する、方法。 - 改変されるべきヌクレオチドが特定のアミノ酸をコードするコドンである、請求項41に記載の方法。
- 少なくとも1つの非線形項が外積項であって、1つの相互作用する残基をコードするコドンの存在を示す1つの変数と、異なる相互作用する残基をコードする別のコドンの存在を示す別の変数との積を含む、外積項である、請求項42に記載の方法。
- 前記配列活性モデルが、前記少なくとも1つの外積項および1つ以上の線形項の合計を含み、各々が前記トレーニングセットにおける可変残基をコードするコドンの存在を示す、請求項43に記載の方法。
- 前記配列活性モデルを構築するための工程が、可能性がある外積項の群から1つ以上の外積項を選択する工程を包含する、請求項43に記載の方法。
- 前記1つ以上の外積項を選択する工程が、異なる外積項を使用する種々のモデルの予測能力に基づいて外積項を選択する遺伝的アルゴリズムを実行する工程を包含する、請求項45に記載の方法。
- 前記活性が、核酸の発現の関数である、請求項41に記載の方法。
- 機械読み取り可能な媒体を備えるコンピュータープログラム製品であって、この媒体に対して、所望の活性に影響するタンパク質改変体ライブラリをコードする核酸におけるバリエーションについてヌクレオチドを同定するためのプログラムコードが提供され、該プログラムコードが:
(a)タンパク質改変体ライブラリのトレーニングセットを特徴付けるデータを受容するためのコードであって、該データが該トレーニングセットにおける各々のタンパク質改変体についての活性およびヌクレオチド配列の情報を提供するコードと;
(b)該データから、ヌクレオチドタイプの関数として活性を予測する配列活性モデルを構築し、該ヌクレオチド配列における位置に対応させるためのコードであって、
該配列活性モデルが1つ以上の非線形項を含み、各々がタンパク質配列中の2つ以上のアミノ酸残基の間の相互作用を示すコードと;
(c)配列活性モデルを用いて、所望の活性に対する影響順で該ヌクレオチド配列中の特定の位置で該ヌクレオチド配列中の位置および/またはヌクレオチドのタイプをランク付けするためのコードと、
(d)該ランク付けを用いて、所望の活性に影響を与えるために改変または固定されるべきヌクレオチド配列において、1つ以上のヌクレオチドを同定するためのコードと、
を含む、コンピュータープログラム製品。 - 改変されるべきヌクレオチドが特定のアミノ酸をコードするコドンである、請求項48に記載のコンピュータープログラム製品。
- 前記少なくとも1つの非線形項が外積項であって、該外積項は、1つの相互作用する残基をコードするコドンの存在を示す1つの変数と、異なる相互作用する残基をコードする別のコドンの存在を示す別の変数との積を含む外積項である、請求項49に記載のコンピュータープログラム製品。
- 前記配列活性モデルが、前記少なくとも1つの外積項および1つ以上の線形項の合計を含み、各々が前記トレーニングセットにおける可変残基をコードするコドンの存在を示す、請求項50に記載のコンピュータープログラム製品。
- 前記配列活性モデルを構築するためのコードが、可能性がある外積項の群から1つ以上の外積項を選択するためのコードを含む、請求項50に記載のコンピュータープログラム製品。
- 前記1つ以上の外積項を選択するためのコードが、種々の外積項を使用する種々のモデルの予測能力に基づいて外積項を選択する遺伝的アルゴリズムを実行するためのコードを含む、請求項52に記載のコンピュータープログラム製品。
- 前記活性が、核酸の発現の関数である、請求項48に記載のコンピュータープログラム製品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/874,802 US20050084907A1 (en) | 2002-03-01 | 2004-06-22 | Methods, systems, and software for identifying functional biomolecules |
PCT/US2005/022119 WO2006002267A1 (en) | 2004-06-22 | 2005-06-21 | Methods, systems, and software for identifying funtional biomolecules |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008503589A true JP2008503589A (ja) | 2008-02-07 |
Family
ID=35159678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007518248A Pending JP2008503589A (ja) | 2004-06-22 | 2005-06-21 | 機能的生体分子を同定するための方法、システムおよびソフトウェア |
Country Status (5)
Country | Link |
---|---|
US (10) | US20050084907A1 (ja) |
EP (1) | EP1761879B1 (ja) |
JP (1) | JP2008503589A (ja) |
DK (1) | DK1761879T3 (ja) |
WO (1) | WO2006002267A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014139787A (ja) * | 2013-01-21 | 2014-07-31 | International Business Maschines Corporation | 表現型予測のためのエピスタシスの効率的なモデル化のための特徴選択方法、情報処理システム、及びコンピュータ・プログラム |
KR20150113167A (ko) * | 2013-01-31 | 2015-10-07 | 코덱시스, 인코포레이티드 | 승법형 모델을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 |
Families Citing this family (154)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5605793A (en) * | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US7024312B1 (en) * | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
CA2396320A1 (en) * | 2000-01-11 | 2001-07-19 | Maxygen, Inc. | Integrated systems and methods for diversity generation and screening |
US20050084907A1 (en) * | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
DK2315145T3 (en) | 2002-03-01 | 2016-01-25 | Codexis Mayflower Holdings Llc | Methods, systems, and software for identifying the functional biomolecules |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US7517494B2 (en) * | 2003-04-30 | 2009-04-14 | Hewlett-Packard Development Company, L.P. | Test tray and test system for determining response of a biological sample |
US8005620B2 (en) * | 2003-08-01 | 2011-08-23 | Dna Twopointo Inc. | Systems and methods for biopolymer engineering |
WO2005013090A2 (en) * | 2003-08-01 | 2005-02-10 | Dna Twopointo Inc. | Systems and methods for biopolymer engineering |
US7844926B1 (en) * | 2006-01-31 | 2010-11-30 | Oracle America, Inc. | Specification window violation identification with application in semiconductor device design |
US8639445B2 (en) * | 2007-07-23 | 2014-01-28 | Microsoft Corporation | Identification of related residues in biomolecular sequences by multiple sequence alignment and phylogenetic analysis |
EP2205727B1 (en) | 2007-10-01 | 2015-06-24 | Codexis, Inc. | Ketoreductase polypeptides for the production of azetidinone |
HUE034642T2 (en) | 2008-02-12 | 2018-02-28 | Codexis Inc | A method for selecting an optimized diverse population of variants |
US8768871B2 (en) * | 2008-02-12 | 2014-07-01 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
US8426178B2 (en) * | 2008-08-27 | 2013-04-23 | Codexis, Inc. | Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine |
US8288141B2 (en) * | 2008-08-27 | 2012-10-16 | Codexis, Inc. | Ketoreductase polypeptides for the production of 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine |
WO2010027710A2 (en) * | 2008-08-27 | 2010-03-11 | Codexis, Inc. | Ketoreductase polypeptides and uses thereof |
EP2329014B1 (en) | 2008-08-29 | 2014-10-22 | Codexis, Inc. | Ketoreductase polypeptides for the stereoselective production of (4s)-3[(5s)-5(4-fluorophenyl)-5-hydroxypentanoyl]-4-phenyl-1,3-oxazolidin-2-one |
US8247192B2 (en) | 2008-11-10 | 2012-08-21 | Codexis, Inc. | Penicillin-G acylases |
US8329438B2 (en) | 2008-12-25 | 2012-12-11 | Codexis, Inc. | Enone reductases |
JP5707344B2 (ja) | 2009-02-26 | 2015-04-30 | コデクシス, インコーポレイテッド | トランスアミナーゼ生体触媒 |
CA2752818A1 (en) | 2009-02-26 | 2010-09-02 | Codexis, Inc. | Beta-glucosidase variant enzymes and related polynucleotides |
WO2010107644A2 (en) | 2009-03-17 | 2010-09-23 | Codexis, Inc. | Variant endoglucanases and related polynucleotides |
CA2757040C (en) | 2009-03-31 | 2016-02-09 | Codexis, Inc. | Improved endoglucanases |
EP2443235A4 (en) | 2009-06-16 | 2013-07-31 | Codexis Inc | ß-glucosidase VARIANTS |
US8921079B2 (en) | 2009-06-22 | 2014-12-30 | Codexis, Inc. | Transaminase reactions |
US8614081B2 (en) | 2009-07-23 | 2013-12-24 | Codexis, Inc. | Nitrilase biocatalysts |
EP2467473B1 (en) | 2009-08-19 | 2016-03-23 | Codexis, Inc. | Ketoreductase polypeptides for the preparation of phenylephrine |
US8785170B2 (en) | 2009-09-04 | 2014-07-22 | Codexis, Inc. | Variant CBH2 cellulases and related polynucleotides |
US8900847B2 (en) | 2009-09-30 | 2014-12-02 | Codexis, Inc. | Polynucleotides encoding recombinant C1 beta-glucosidase for production of sugars from cellulosic biomass |
US8916366B2 (en) | 2009-11-20 | 2014-12-23 | Codexis, Inc. | Multi-cellulase enzyme compositions for hydrolysis of cellulosic biomass |
RU2012126131A (ru) | 2009-11-25 | 2013-12-27 | Кодексис, Инк. | РЕКОМБИНАНТНЫЕ ВАРИАНТЫ β-ГЛЮКОЗИДАЗЫ ДЛЯ ПРОДУКЦИИ РАСТВОРИМЫХ САХАРОВ ИЗ ЦЕЛЛЮЛОЗНОЙ БИОМАССЫ |
SI2510089T1 (sl) | 2009-12-08 | 2015-12-31 | Codexis, Inc. | Sinteza prazolnih spojin |
WO2013003290A1 (en) | 2011-06-28 | 2013-01-03 | Codexis, Inc. | Protein variant generation by region shuffling |
WO2011123576A2 (en) | 2010-03-31 | 2011-10-06 | Codexis, Inc. | Production of monoterpenes |
HUE026367T2 (en) | 2010-05-04 | 2016-06-28 | Codexis Inc | Biocatalysts of ezetimibe synthesis |
EP2569426A4 (en) | 2010-05-14 | 2013-10-09 | Codexis Inc | ZELLBIOHYDROLASE VARIANTS |
EP2576804B1 (en) | 2010-05-28 | 2016-12-14 | Codexis, Inc. | Pentose fermentation by a recombinant microorganism |
US8932836B2 (en) | 2010-08-16 | 2015-01-13 | Codexis, Inc. | Biocatalysts and methods for the synthesis of (1R,2R)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine |
CA2807702C (en) | 2010-08-20 | 2018-07-24 | Codexis, Inc. | Use of glycoside hydrolase 61 family proteins in processing of cellulose |
WO2012024662A2 (en) | 2010-08-20 | 2012-02-23 | Codexis, Inc. | Expression constructs comprising fungal promoters |
BR112013010812A2 (pt) | 2010-11-02 | 2016-07-12 | Codexis Inc | composições e métodos para produção de açúcares fermentáveis. |
ES2604114T3 (es) | 2010-11-02 | 2017-03-03 | Codexis, Inc. | Cepas de hongos mejoradas |
EP2649187B1 (en) | 2010-12-08 | 2017-11-22 | Codexis, Inc. | Biocatalysts and methods for the synthesis of armodafinil |
WO2012088159A2 (en) | 2010-12-21 | 2012-06-28 | Codexis, Inc. | Endoglucanase variants |
US8663962B2 (en) | 2011-03-30 | 2014-03-04 | Codexis, Inc. | Pentose fermentation by a recombinant microorganism |
EP2697662B1 (en) | 2011-04-13 | 2018-06-06 | Codexis, Inc. | Biocatalytic process for preparing eslicarbazepine and analogs thereof |
WO2013003219A1 (en) | 2011-06-30 | 2013-01-03 | Codexis, Inc. | Pentose fermentation by a recombinant microorganism |
EP2748317B1 (en) | 2011-08-22 | 2017-04-19 | Codexis, Inc. | Gh61 glycoside hydrolase protein variants and cofactors that enhance gh61 activity |
WO2013028278A1 (en) | 2011-08-23 | 2013-02-28 | Codexis, Inc. | Cellobiohydrolase variants |
WO2013036861A1 (en) | 2011-09-08 | 2013-03-14 | Codexis, Inc | Biocatalysts and methods for the synthesis of substituted lactams |
US20130084608A1 (en) | 2011-09-30 | 2013-04-04 | Codexis, Inc. | Fungal proteases |
IN2014CN04470A (ja) | 2011-11-18 | 2015-09-04 | Codexis Inc | |
WO2013096244A1 (en) | 2011-12-20 | 2013-06-27 | Codexis, Inc. | Endoglucanase 1b (eg1b) variants |
EP2794884A4 (en) | 2011-12-20 | 2015-09-16 | Codexis Inc | FAT ALCOHOL PRODUCED ACYL REDUCTASE (VARIANTS) AND METHOD OF USE THEREOF |
US20130252280A1 (en) * | 2012-03-07 | 2013-09-26 | Genformatic, Llc | Method and apparatus for identification of biomolecules |
CN104508126B (zh) | 2012-03-23 | 2017-06-30 | 科德克希思公司 | 用于合成色胺和色胺类似物的衍生物的生物催化剂和方法 |
US20150133698A1 (en) | 2012-04-20 | 2015-05-14 | Codexis, Inc. | Production of fatty alcohols from engineered microorganisms |
HUE042605T2 (hu) | 2012-05-08 | 2019-07-29 | Codexis Inc | Biokatalizátorok és kémiai vegyületek hidroxilálására szolgáló eljárások |
WO2013170050A1 (en) | 2012-05-11 | 2013-11-14 | Codexis, Inc. | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds |
US8980578B2 (en) | 2012-06-11 | 2015-03-17 | Codexis, Inc. | Fungal beta-xylosidase variants |
US9650655B2 (en) | 2012-07-20 | 2017-05-16 | Codexis, Inc. | Production of fatty alcohols from engineered microorganisms |
US9506087B2 (en) | 2012-08-07 | 2016-11-29 | Codexis, Inc. | Glucose and xylose co-utilization in E. coli |
CN104955949A (zh) | 2012-11-20 | 2015-09-30 | 科德克希思公司 | 通过重组微生物的戊糖发酵 |
US9512447B2 (en) | 2012-12-14 | 2016-12-06 | Codexis, Inc. | Modified native beta-ketoacyl-ACP synthases and engineered microorganisms |
WO2014099730A1 (en) | 2012-12-21 | 2014-06-26 | Codexis, Inc. | Engineered biocatalysts and methods for synthesizing chiral amines |
EP2946006B1 (en) | 2013-01-18 | 2019-04-10 | Codexis, Inc. | Engineered biocatalysts useful for carbapenem synthesis |
DK2961844T3 (da) | 2013-02-28 | 2019-01-02 | Codexis Inc | Modificerede transaminasepolypeptider til industriel biokatalyse |
US9670493B2 (en) | 2013-03-14 | 2017-06-06 | Codexis, Inc. | Low-phosphate repressible promoter |
DK2986722T3 (da) | 2013-04-18 | 2019-05-13 | Codexis Inc | Manipulerede phenylalaninammoniak-lyasepolypeptider |
KR102423377B1 (ko) | 2013-08-05 | 2022-07-25 | 트위스트 바이오사이언스 코포레이션 | 드 노보 합성된 유전자 라이브러리 |
CA2923755C (en) | 2013-09-27 | 2023-03-14 | Codexis, Inc. | Automated screening of enzyme variants |
US20150134315A1 (en) | 2013-09-27 | 2015-05-14 | Codexis, Inc. | Structure based predictive modeling |
JP6643987B2 (ja) | 2013-11-13 | 2020-02-12 | コデクシス, インコーポレイテッド | ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法 |
EP3145536B1 (en) | 2014-04-16 | 2021-10-27 | Codexis, Inc. | Engineered tyrosine ammonia lyase |
EP3167052B1 (en) | 2014-07-09 | 2020-01-01 | Codexis, Inc. | P450-bm3 variants with improved activity |
US10273229B2 (en) | 2014-08-28 | 2019-04-30 | Codexis, Inc. | N-substituted 4-aminoquinazoline derivatives and methods of use |
WO2016033304A1 (en) | 2014-08-28 | 2016-03-03 | Codexis, Inc. | Imidazoyl anilide derivatives and methods of use |
JP6719463B2 (ja) | 2014-11-25 | 2020-07-15 | コデクシス, インコーポレイテッド | ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法 |
US9747636B2 (en) | 2014-12-08 | 2017-08-29 | Bank Of America Corporation | Enhancing information security using an information passport dashboard |
PT3237621T (pt) | 2014-12-22 | 2023-07-20 | Codexis Inc | Variantes da alfa-galactosidase humana |
CA2975852A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
ES2830725T3 (es) | 2015-02-10 | 2021-06-04 | Codexis Inc | Polipéptidos cetoreductasa para la síntesis de compuestos quirales |
WO2016172377A1 (en) | 2015-04-21 | 2016-10-27 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
SG11201708356PA (en) | 2015-05-07 | 2017-11-29 | Codexis Inc | Penicillin-g acylases |
DK3319987T3 (da) | 2015-07-07 | 2021-06-21 | Codexis Inc | Nye p450-bm3-varianter med forbedret aktivitet |
CN108368482A (zh) | 2015-09-18 | 2018-08-03 | 特韦斯特生物科学公司 | 寡核酸变体文库及其合成 |
KR20180058772A (ko) | 2015-09-22 | 2018-06-01 | 트위스트 바이오사이언스 코포레이션 | 핵산 합성을 위한 가요성 기판 |
CN108603307A (zh) | 2015-12-01 | 2018-09-28 | 特韦斯特生物科学公司 | 功能化表面及其制备 |
US10379502B2 (en) * | 2016-04-11 | 2019-08-13 | Accenture Global Solutions Limited | Control system with machine learning time-series modeling |
EP3452940A4 (en) | 2016-05-04 | 2020-01-01 | Deep Genomics Incorporated | METHODS AND SYSTEMS FOR THE PRODUCTION OF AN EXTENDED EXERCISE DATA SET FOR MACHINE LEARNING WITH BIOLOGICAL SEQUENCES |
CN109715793A (zh) | 2016-05-05 | 2019-05-03 | 科德克希思公司 | 青霉素-g 酰化酶 |
CN109715817B (zh) | 2016-06-09 | 2022-12-09 | 科德克希思公司 | 用于化合物的羟基化的生物催化剂和方法 |
SG11201810998WA (en) | 2016-06-15 | 2019-01-30 | Codexis Inc | Engineered beta-glucosidases and glucosylation methods |
JP6854340B2 (ja) | 2016-08-22 | 2021-04-07 | ツイスト バイオサイエンス コーポレーション | デノボ合成された核酸ライブラリ |
JP7316662B2 (ja) | 2016-08-26 | 2023-07-28 | コデクシス, インコーポレイテッド | 操作されたイミンレダクターゼ、ならびにケトン化合物およびアミン化合物の還元的アミノ化のための方法 |
KR102217487B1 (ko) | 2016-09-21 | 2021-02-23 | 트위스트 바이오사이언스 코포레이션 | 핵산 기반 데이터 저장 |
EA201991262A1 (ru) | 2016-12-16 | 2020-04-07 | Твист Байосайенс Корпорейшн | Библиотеки вариантов иммунологического синапса и их синтез |
JP7019202B2 (ja) | 2017-01-05 | 2022-02-15 | コデクシス, インコーポレイテッド | ペニシリンgアシラーゼ |
WO2018144675A1 (en) | 2017-02-03 | 2018-08-09 | Codexis, Inc. | Engineered glycosyltransferases and steviol glycoside glucosylation methods |
CA3051262A1 (en) | 2017-02-13 | 2018-08-16 | Codexis, Inc. | Engineered phenylalanine ammonia lyase polypeptides |
EP3586255A4 (en) | 2017-02-22 | 2021-03-31 | Twist Bioscience Corporation | NUCLEIC ACID-BASED DATA STORAGE |
WO2018170169A1 (en) * | 2017-03-15 | 2018-09-20 | Twist Bioscience Corporation | Variant libraries of the immunological synapse and synthesis thereof |
CN117511890A (zh) | 2017-04-27 | 2024-02-06 | 科德克希思公司 | 酮还原酶多肽及多核苷酸 |
CA3062550A1 (en) | 2017-05-08 | 2018-11-15 | Codexis, Inc. | Engineered ligase variants |
WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
CA3066744A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
US11359183B2 (en) | 2017-06-14 | 2022-06-14 | Codexis, Inc. | Engineered transaminase polypeptides for industrial biocatalysis |
WO2019005337A1 (en) | 2017-06-27 | 2019-01-03 | Codexis, Inc. | PENICILLIN G ACYLASES |
US10738286B2 (en) | 2017-06-30 | 2020-08-11 | Codexis, Inc. | T7 RNA polymerase variants |
JP2020530266A (ja) | 2017-06-30 | 2020-10-22 | コデクシス, インコーポレイテッド | T7 rnaポリメラーゼバリアント |
CA3075505A1 (en) | 2017-09-11 | 2019-03-14 | Twist Bioscience Corporation | Gpcr binding proteins and synthesis thereof |
GB2583590A (en) | 2017-10-20 | 2020-11-04 | Twist Bioscience Corp | Heated nanowells for polynucleotide synthesis |
CA3080512A1 (en) | 2017-11-07 | 2019-05-16 | Codexis, Inc. | Transglutaminase variants |
JP2021506252A (ja) | 2017-12-13 | 2021-02-22 | コデクシス, インコーポレイテッド | アミドカップリングのためのカルボキシエステラーゼポリペプチド |
JP7191448B2 (ja) | 2018-01-04 | 2022-12-19 | ツイスト バイオサイエンス コーポレーション | Dnaベースのデジタル情報ストレージ |
AU2019270243A1 (en) | 2018-05-18 | 2021-01-07 | Twist Bioscience Corporation | Polynucleotides, reagents, and methods for nucleic acid hybridization |
US10900055B2 (en) | 2018-06-12 | 2021-01-26 | Codexis, Inc. | Engineered tyrosine ammonia lyase |
EP3820502A4 (en) | 2018-07-09 | 2022-07-20 | Codexis, Inc. | MODIFIED PURINE NUCLEOSIDE PHOSPHORYLASE ENZYME VARIANT |
CN112673091A (zh) | 2018-07-09 | 2021-04-16 | 科德克希思公司 | 工程化泛酸激酶变体酶 |
CN112673105A (zh) | 2018-07-09 | 2021-04-16 | 科德克希思公司 | 工程化脱氧核糖磷酸醛缩酶 |
KR20210031933A (ko) | 2018-07-09 | 2021-03-23 | 코덱시스, 인코포레이티드 | 조작된 포스포펜토뮤타제 변이체 효소 |
WO2020014049A1 (en) | 2018-07-09 | 2020-01-16 | Codexis, Inc. | Engineered galactose oxidase variant enzymes |
EP3820833A4 (en) | 2018-07-12 | 2022-08-03 | Codexis, Inc. | MODIFIED AMMONIA-LYASE PHENYLALANINE POLYPEPTIDES |
KR20210040408A (ko) | 2018-07-30 | 2021-04-13 | 코덱시스, 인코포레이티드 | 조작된 글리코실트랜스퍼라제 및 스테비올 글리코시드 글루코실화 방법 |
SG11202103639SA (en) | 2018-10-29 | 2021-05-28 | Codexis Inc | Engineered dna polymerase variants |
SG11202105668PA (en) | 2018-12-14 | 2021-06-29 | Codexis Inc | Engineered tyrosine ammonia lyase |
BR112021011750A2 (pt) | 2018-12-20 | 2021-08-31 | Codexis, Inc. | Alfa-galactosidase a recombinante e/ou fragmento de alfa-galactosidase a recombinante, composição, sequência de polinucleotídeo recombinante, vetor de expressão, célula hospedeira, métodos para produzir uma variante de alfa-galactosidase a e para tratar e/ou prevenir os sintomas da doença de fabry, composição farmacêutica, e, uso das composições |
WO2020176678A1 (en) | 2019-02-26 | 2020-09-03 | Twist Bioscience Corporation | Variant nucleic acid libraries for glp1 receptor |
SG11202109283UA (en) | 2019-02-26 | 2021-09-29 | Twist Bioscience Corp | Variant nucleic acid libraries for antibody optimization |
MX2021012988A (es) * | 2019-04-22 | 2022-03-04 | Orbit Genomics Inc | Metodos y sistemas de analisis de microsatelite. |
JP2022533003A (ja) * | 2019-04-30 | 2022-07-21 | アムジエン・インコーポレーテツド | バイオ医薬品生産における細胞株選択のためのデータ駆動予測モデリング |
GB201906566D0 (en) * | 2019-05-09 | 2019-06-26 | Labgenius Ltd | Methods and systems for protein engineering and production |
CN114729342A (zh) | 2019-06-21 | 2022-07-08 | 特韦斯特生物科学公司 | 基于条形码的核酸序列装配 |
KR20220106738A (ko) | 2019-08-30 | 2022-07-29 | 코덱시스, 인코포레이티드 | 조작된 리파제 변이체 |
EP4004200A4 (en) * | 2019-09-13 | 2023-08-02 | The University of Chicago | METHOD AND APPARATUS USING MACHINE LEARNING FOR EVOLUTIONARY DATA-DRIVEN DESIGN OF PROTEINS AND OTHER SEQUENCE-DEFINED BIOMOLECULES |
CN110970098A (zh) * | 2019-11-26 | 2020-04-07 | 重庆大学 | 一种功能多肽苦味预测方法 |
BR112022011760A2 (pt) | 2019-12-20 | 2022-08-30 | Codexis Inc | Fragmento de alfa glicosidase ácida recombinante e/ou de alfa glicosidase ácida recombinante biologicamente ativa, alfa glicosidase ácida recombinante, composição, sequência polinucleotídica recombinante, vetor de expressão, vetor de expressão pdh, célula hospedeira, método para produzir uma variante de alfa glicosidase ácida recombinante, variante de alfa glicosidase ácida recombinante, composição farmacêutica para o tratamento da doença de pompe, composição farmacêutica, método para tratar e/ou prevenir os sintomas da doença de pompe em um indivíduo, e, uso das composições |
EP4133064A2 (en) | 2020-04-10 | 2023-02-15 | Codexis, Inc. | Engineered transaminase polypeptides |
EP4204554A1 (en) | 2020-08-28 | 2023-07-05 | Codexis, Inc. | Engineered protease variants |
US11767519B2 (en) | 2020-08-28 | 2023-09-26 | Codexis, Inc. | Engineered amylase variants |
US20220165359A1 (en) | 2020-11-23 | 2022-05-26 | Peptilogics, Inc. | Generating anti-infective design spaces for selecting drug candidates |
US20220186231A1 (en) | 2020-12-11 | 2022-06-16 | Willow Biosciences, Inc. | Recombinant acyl activating enzyme (aae) genes for enhanced biosynthesis of cannabinoids and cannabinoid precursors |
WO2022133289A2 (en) | 2020-12-18 | 2022-06-23 | Codexis, Inc. | Engineered uridine phosphorylase variant enzymes |
US11439159B2 (en) | 2021-03-22 | 2022-09-13 | Shiru, Inc. | System for identifying and developing individual naturally-occurring proteins as food ingredients by machine learning and database mining combined with empirical testing for a target food function |
EP4314263A1 (en) | 2021-04-02 | 2024-02-07 | Codexis, Inc. | Engineered adenylate kinase variant enzymes |
EP4314262A1 (en) | 2021-04-02 | 2024-02-07 | Codexis, Inc. | Engineered guanylate kinase variant enzymes |
IL305928A (en) | 2021-04-02 | 2023-11-01 | Codexis Inc | Transgenic enzymes of acetate kinase variant |
IL305924A (en) | 2021-04-02 | 2023-11-01 | Codexis Inc | Cyclic GMP-AMP synthase (CGAS) variant transgenic enzymes |
WO2023010083A2 (en) | 2021-07-30 | 2023-02-02 | Willow Biosciences, Inc. | Recombinant prenyltransferase polypeptides engineered for enhanced biosynthesis of cannabinoids |
CA3227236A1 (en) | 2021-08-19 | 2023-02-23 | Trish Choudhary | Recombinant olivetolic acid cyclase polypeptides engineered for enhanced biosynthesis of cannabinoids |
WO2023069921A1 (en) | 2021-10-19 | 2023-04-27 | Epimeron Usa, Inc. | Recombinant thca synthase polypeptides engineered for enhanced biosynthesis of cannabinoids |
WO2024040020A1 (en) | 2022-08-15 | 2024-02-22 | Absci Corporation | Quantitative affinity activity specific cell enrichment |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003075129A2 (en) * | 2002-03-01 | 2003-09-12 | Maxygen, Inc. | Methods, systems, and software for identifying functional bio-molecules |
WO2003085548A1 (fr) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Dispositif et procede d'analyse de donnees |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6537776B1 (en) * | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
US7315786B2 (en) | 1998-10-16 | 2008-01-01 | Xencor | Protein design automation for protein libraries |
US20020048772A1 (en) | 2000-02-10 | 2002-04-25 | Dahiyat Bassil I. | Protein design automation for protein libraries |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
DE60044223D1 (de) | 1999-01-19 | 2010-06-02 | Maxygen Inc | Durch oligonukleotide-vermittelte nukleinsäuren-rekombination |
US7024312B1 (en) * | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
CA2293830C (en) * | 1999-12-31 | 2008-07-29 | Digital Security Controls Ltd. | Photoelectric smoke detector and chamber therefor |
DK1255826T3 (da) | 2000-02-10 | 2006-01-30 | Xencor Inc | Automatisering af proteindesign for proteinbiblioteker |
AU2001238397A1 (en) | 2000-02-17 | 2001-08-27 | California Institute Of Technology | Computationally targeted evolutionary design |
US20010051855A1 (en) | 2000-02-17 | 2001-12-13 | California Institute Of Technology | Computationally targeted evolutionary design |
US20030032059A1 (en) | 2000-05-23 | 2003-02-13 | Zhen-Gang Wang | Gene recombination and hybrid protein development |
AU2001263411A1 (en) * | 2000-05-23 | 2001-12-03 | California Institute Of Technology | Gene recombination and hybrid protein development |
EP1325457A4 (en) * | 2000-10-10 | 2007-10-24 | Genencor Int | LIBRARIES RICH IN INFORMATION |
US20030036854A1 (en) * | 2001-02-06 | 2003-02-20 | The Penn State Research Foundation | Apparatus and method for designing proteins and protein libraries |
US7747391B2 (en) * | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US7991557B2 (en) | 2004-06-19 | 2011-08-02 | Genenews Corporation | Computer system and methods for constructing biological classifiers and uses thereof |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
DK2885408T3 (da) * | 2012-08-16 | 2023-04-11 | Synthetic Genomics Inc | Digital til biologisk konverter |
DK3082056T4 (da) | 2015-04-14 | 2022-05-02 | Peaccel | Fremgangsmåde og elektronisk system til forudsigelse af mindst en fitnessværdi af et protein, relateret computerprogramprodukt |
-
2004
- 2004-06-22 US US10/874,802 patent/US20050084907A1/en not_active Abandoned
-
2005
- 2005-06-21 WO PCT/US2005/022119 patent/WO2006002267A1/en active Application Filing
- 2005-06-21 DK DK05779687.2T patent/DK1761879T3/da active
- 2005-06-21 EP EP05779687.2A patent/EP1761879B1/en active Active
- 2005-06-21 JP JP2007518248A patent/JP2008503589A/ja active Pending
-
2007
- 2007-02-12 US US11/706,034 patent/US7747393B2/en active Active
- 2007-10-30 US US11/981,578 patent/US8762066B2/en active Active
- 2007-10-30 US US11/981,566 patent/US20080220990A1/en not_active Abandoned
- 2007-10-30 US US11/981,567 patent/US20080147369A1/en not_active Abandoned
-
2009
- 2009-09-10 US US12/557,467 patent/US20100004136A1/en not_active Abandoned
- 2009-09-10 US US12/557,469 patent/US20100005047A1/en not_active Abandoned
- 2009-09-10 US US12/557,465 patent/US20100004135A1/en not_active Abandoned
-
2014
- 2014-04-18 US US14/256,692 patent/US9864833B2/en active Active
- 2014-11-07 US US14/536,242 patent/US10453554B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003075129A2 (en) * | 2002-03-01 | 2003-09-12 | Maxygen, Inc. | Methods, systems, and software for identifying functional bio-molecules |
WO2003085548A1 (fr) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Dispositif et procede d'analyse de donnees |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014139787A (ja) * | 2013-01-21 | 2014-07-31 | International Business Maschines Corporation | 表現型予測のためのエピスタシスの効率的なモデル化のための特徴選択方法、情報処理システム、及びコンピュータ・プログラム |
US10102333B2 (en) | 2013-01-21 | 2018-10-16 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
US10108775B2 (en) | 2013-01-21 | 2018-10-23 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
US11335434B2 (en) | 2013-01-21 | 2022-05-17 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
US11335433B2 (en) | 2013-01-21 | 2022-05-17 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
KR20150113167A (ko) * | 2013-01-31 | 2015-10-07 | 코덱시스, 인코포레이티드 | 승법형 모델을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 |
JP2016504924A (ja) * | 2013-01-31 | 2016-02-18 | コデクシス, インコーポレイテッド | 乗法形式のモデルを使用して生体分子を同定する方法、システム、およびソフトウェア |
JP2016511884A (ja) * | 2013-01-31 | 2016-04-21 | コデクシス, インコーポレイテッド | 相互作用する構成要素を有する生体分子を同定するための方法、システム、およびソフトウェア |
US9665694B2 (en) | 2013-01-31 | 2017-05-30 | Codexis, Inc. | Methods, systems, and software for identifying bio-molecules with interacting components |
US9684771B2 (en) | 2013-01-31 | 2017-06-20 | Codexis, Inc. | Methods, systems, and software for identifying bio-molecules using models of multiplicative form |
JP2018161148A (ja) * | 2013-01-31 | 2018-10-18 | コデクシス, インコーポレイテッド | 乗法形式のモデルを使用して生体分子を同定する方法、システム、およびソフトウェア |
KR102215219B1 (ko) * | 2013-01-31 | 2021-02-16 | 코덱시스, 인코포레이티드 | 승법형 모델을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 |
Also Published As
Publication number | Publication date |
---|---|
US20150065357A1 (en) | 2015-03-05 |
DK1761879T3 (da) | 2013-09-30 |
US20100004135A1 (en) | 2010-01-07 |
US20140249035A1 (en) | 2014-09-04 |
US8762066B2 (en) | 2014-06-24 |
WO2006002267A1 (en) | 2006-01-05 |
US20080220990A1 (en) | 2008-09-11 |
US9864833B2 (en) | 2018-01-09 |
US10453554B2 (en) | 2019-10-22 |
US7747393B2 (en) | 2010-06-29 |
US20080147369A1 (en) | 2008-06-19 |
US20050084907A1 (en) | 2005-04-21 |
EP1761879A1 (en) | 2007-03-14 |
US20100004136A1 (en) | 2010-01-07 |
US20070239364A1 (en) | 2007-10-11 |
EP1761879B1 (en) | 2013-08-14 |
US20080132416A1 (en) | 2008-06-05 |
US20100005047A1 (en) | 2010-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10453554B2 (en) | Methods, systems, and software for identifying functional bio-molecules | |
JP6655670B2 (ja) | 乗法形式のモデルを使用して生体分子を同定する方法、システム、およびソフトウェア | |
JP5319865B2 (ja) | 機能的生体分子を同定する方法、システム、およびソフトウェア | |
US9996661B2 (en) | Methods, systems, and software for identifying functional bio-molecules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110121 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110419 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110426 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110518 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110720 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20111201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120208 |