RU2015136780A - Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы - Google Patents

Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы Download PDF

Info

Publication number
RU2015136780A
RU2015136780A RU2015136780A RU2015136780A RU2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A
Authority
RU
Russia
Prior art keywords
sequence
activity
protein
model
models
Prior art date
Application number
RU2015136780A
Other languages
English (en)
Other versions
RU2664695C2 (ru
Inventor
Грегори Аллан КОУП
Николас Джон АГАРД
Original Assignee
Кодексис, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Кодексис, Инк. filed Critical Кодексис, Инк.
Publication of RU2015136780A publication Critical patent/RU2015136780A/ru
Application granted granted Critical
Publication of RU2664695C2 publication Critical patent/RU2664695C2/ru

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides

Claims (91)

1. Способ проведения направленной эволюции, причем данный способ включает
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой или нуклеиновокислотной последовательности, и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одной или более мутаций для цикла направленной эволюции посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;
(d) получение множества олигонуклеотидов, содержащих или кодирующих одну или более мутаций, выбранных в (c); и
(e) осуществление цикла направленной эволюции с использованием множества олигонуклеотидов, полученных в (d).
2. Способ по п. 1, в котором выбор мутации для цикла направленной эволюции содержит идентификацию одного или более коэффициентов, которые, как определено, больше, чем другие коэффициенты, и выбор определенной аминокислоты или нуклеотида в определенном положении, представляемых одним или более коэффициентами, идентифицированными таким образом.
3. Способ по любому из предшествующих пунктов, в котором получение множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c), содержит синтезирование олигонуклеотидов с помощью синтезатора нуклеиновых кислот.
4. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит фрагментирование и рекомбинирование белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.
5. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит осуществление насыщающего мутагенеза в отношении белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.
6. Способ проведения направленной эволюции, причем данный способ включает:
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одной или более мутаций посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;
(d) идентифицирование новой белковой или новой нуклеиновокислотной последовательности, содержащей одну или более мутаций, выбранных в (c); и
(e) получение и анализирование нового белка или белка, кодируемого новой нуклеиновокислотной последовательностью.
7. Способ по п. 6, дополнительно содержащий использование новой белковой или новой нуклеиновокислотной последовательности,
идентифицированной в (d), в качестве исходной точки для дальнейшей направленной эволюции.
8. Способ по п. 6, дополнительно содержащий проведение насыщающего мутагенеза в одном или более положениях мутаций, выбранных в (c).
9. Способ проведения направленной эволюции, причем данный способ включает,
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одного или более положений в белковой последовательности или нуклеиновокислотной последовательности посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность; и
(d) проведение насыщающего мутагенеза в одном или более положениях, идентифицированных в (c).
10. Способ проведения направленной эволюции, причем данный способ включает,
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-
активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) использование множественных белковых последовательностей или множественных аминокислотных последовательностей в модели последовательность-активность и определение значений активности, предсказанных моделью последовательность-активность для каждой из множественных белковых последовательностей или нуклеиновокислотных последовательностей;
(d) выбор новой белковой последовательности или новой нуклеиновокислотной последовательности из множественных белковых последовательностей или множественных аминокислотных последовательностей, использованных в (c), посредством оценивания значений активности, предсказанных моделью последовательность-активность для данных множественных последовательностей; и
(e) получение и анализирование белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью.
11. Способ по п. 10, в котором получение белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью, содержит синтезирование нового белка или новой нуклеиновокислотной последовательности.
12. Способ по любому из пп. 1, 6, 9 и 10, в котором каждый из членов, содержащих коэффициенты, содержит произведение коэффициента и независимой переменной, причем коэффициент, представляет вклад в активность определенной аминокислоты или нуклеотида в определенном положении, и независимая переменная представляет присутствие или отсутствие определенной
аминокислоты или нуклеотида в определенном положении для соответствующего коэффициента.
13. Способ по п. 12, в котором каждый из членов, содержащих коэффициенты, представлен в форме (1 + коэффициент × независимая переменная).
14. Способ по любому из пп. 1, 6, 9 и 10, в котором коэффициенты представлены в таблице соответствия.
15. Способ по любому из пп. 1, 6, 9 и 10, в котором модель последовательность-активность содержит зависимость между зависимой переменной, представляющей активность вариантов белков, и произведением множественных членов.
16. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит перетасовку множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c).
17. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит формирование библиотеки белковых вариантов.
18. Способ по п. 17, дополнительно содержащий анализирование активности и секвенирование членов библиотеки белковых вариантов.
19. Способ по п. 18, дополнительно содержащий использование информации об активности и последовательности для библиотеки белковых вариантов для генерации и использования новой модели последовательность-активность посредством осуществления операций (b)-(e) в отношении информации об активности и последовательности для библиотеки белковых вариантов.
20. Способ по любому из пп. 1, 6, 9 и 10, в котором по меньшей мере один из более членов модели последовательность-активность содержит коэффициент взаимодействия, представляющий вклад в активность определенной комбинации (i) первой аминокислоты или нуклеотида в первом положении в последовательности и (ii) второй аминокислоты или нуклеотида во втором положении в последовательности, и
в котором коэффициент взаимодействия представляет вклад в
активность упомянутой определенной комбинации.
21. Способ по любому из п. 21, в котором генерация модели последовательность-активность содержит осуществление пошагового добавления или удаления членов, содержащих коэффициенты взаимодействия.
22. Способ по п. 20, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для выбора одного или более членов, содержащих коэффициенты взаимодействия.
23. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для уточнения значений коэффициентов.
24. Способ по п. 22, в котором генерация модели последовательность-активность содержит;
(i) получение поколения моделей, причем каждое содержит произведение множественных членов и зависимой переменной, как изложено в (b);
(ii) использование каждой из моделей в поколении моделей для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;
(iii) выбор одной или более моделей из поколения моделей на основании способности моделей точно предсказывать активность множества вариантов белков;
(iv) модифицирование выбранных одной или более моделей для получения следующего поколения моделей; и
(v) многократное повторение (ii)-(iv) со следующим поколением моделей для генерации модели последовательность-активность (b).
25. Способ по п. 23, в котором генерация модели последовательность-активность содержит;
(i) получение поколения моделей, причем каждое содержит произведение множественных членов и зависимой переменной, как изложено в (b);
(ii) использование каждой из моделей в поколении моделей
для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;
(iii) выбор одной или более моделей из поколения моделей на основании способности моделей точно предсказывать активность множества вариантов белков;
(iv) модифицирование выбранных одной или более моделей для получения следующего поколения моделей; и
(v) многократное повторение (ii)-(iv) со следующим поколением моделей для генерации модели последовательность-активность (b).
26. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование априорной информации для определения апостериорных распределений вероятностей модели.
27. Способ по любому из пп. 1, 6, 9 и 10, дополнительно содержащий генерацию ансамбля моделей последовательность-активность, причем каждая имеет форму, приведенную в (b).
28. Способ по п. 27, дополнительно содержащий генерацию ансамблевой модели, включающей члены из двух или более моделей последовательность-активность, причем данные члены ансамблевой модели взвешены по способности данных двух или более моделей предсказывать активность.
29. Способ по п. 27, дополнительно содержащий использование ансамблевой модели для выбора мутаций для цикла направленной эволюции.
30. Способ проведения направленной эволюции биологических молекул, причем данный способ включает,
(a) получение данных о последовательности и активности для множества биологических молекул, причем каждая биологическая молекула содержит последовательность, содержащую субъединицы различных типов и положений в последовательности;
(b) построение модели последовательность-активность по полученным данным, причем
модель последовательность-активность предсказывает активность как функцию типа субъединиц и положения субъединиц в
последовательности,
модель последовательность-активность содержит произведение множества основных мультипликативных членов, причем каждый из основных мультипликативных членов содержит (1) фиктивную переменную, представляющую присутствие/отсутствие определенной субъединицы конкретного типа в конкретном положении в последовательности, и (2) коэффициент, представляющий вклад определенной субъединицы в активность; и
(c) использование модели последовательность-активность, для того чтобы идентифицировать одну или более субъединиц конкретных типов в конкретных положениях для вариации для воздействия на желаемую активность биологических молекул.
31. Способ по п. 30, в котором последовательность представляет собой весь геном, целую хромосому, сегмент хромосомы, коллекцию последовательностей генов взаимодействующих генов, ген, белок или полисахарид или любую их комбинацию.
32. Способ по п. 30, в котором субъединица представляет собой хромосому, сегмент хромосомы, гаплотип, ген, кодон, мутацию, нуклеотид, аминокислоту, моносахарид, липид или любую их комбинацию.
33. Компьютерная система, содержащая:
один или более процессоров;
системную память; и
одну или более читаемых компьютером сред для хранения, несущих сохраненные на них выполнимые компьютером инструкции, которые, когда выполняются одним или более процессорами, вынуждают компьютерную систему осуществлять способ проведения направленной эволюции биологических молекул, причем данный способ включает:
(a) получение данных о последовательности и активности для множества биологических молекул, причем каждая биологическая молекула содержит последовательность, содержащую субъединицы различных типов и положений в последовательности;
(b) построение модели последовательность-активность по полученным данным, причем
модель последовательность-активность предсказывает
активность как функцию типа субъединиц и положения субъединиц в последовательности,
модель последовательность-активность содержит произведение множества основных мультипликативных членов, причем каждый из основных мультипликативных членов содержит (1) фиктивную переменную, представляющую присутствие/отсутствие определенной субъединицы конкретного типа в конкретном положении в последовательности, и (2) коэффициент, представляющий вклад определенной субъединицы в активность; и
(c) использование модели последовательность-активность, для того чтобы идентифицировать одну или более субъединиц конкретных типов в конкретных положениях для вариации для воздействия на желаемую активность биологических молекул.
RU2015136780A 2013-01-31 2014-01-29 Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы RU2664695C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361759276P 2013-01-31 2013-01-31
US61/759,276 2013-01-31
US201361799377P 2013-03-15 2013-03-15
US61/799,377 2013-03-15
PCT/US2014/013668 WO2014120821A1 (en) 2013-01-31 2014-01-29 Methods, systems, and software for identifying bio-molecules using models of multiplicative form

Publications (2)

Publication Number Publication Date
RU2015136780A true RU2015136780A (ru) 2017-03-10
RU2664695C2 RU2664695C2 (ru) 2018-08-21

Family

ID=51223867

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2015136776A RU2695146C2 (ru) 2013-01-31 2014-01-29 Способы, системы и программное обеспечение для идентификации биомолекул со взаимодействующими компонентами
RU2015136780A RU2664695C2 (ru) 2013-01-31 2014-01-29 Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2015136776A RU2695146C2 (ru) 2013-01-31 2014-01-29 Способы, системы и программное обеспечение для идентификации биомолекул со взаимодействующими компонентами

Country Status (15)

Country Link
US (4) US9684771B2 (ru)
EP (2) EP2951754B1 (ru)
JP (4) JP6433028B2 (ru)
KR (3) KR20150113166A (ru)
CN (3) CN109360608B (ru)
AU (2) AU2014212430B2 (ru)
BR (2) BR112015018454B1 (ru)
CA (2) CA2898777C (ru)
DK (1) DK2951754T3 (ru)
IL (2) IL240056A0 (ru)
LT (1) LT2951754T (ru)
NZ (2) NZ710299A (ru)
RU (2) RU2695146C2 (ru)
SG (2) SG11201505977RA (ru)
WO (2) WO2014120819A1 (ru)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201505977RA (en) 2013-01-31 2015-08-28 Codexis Inc Methods, systems, and software for identifying bio-molecules using models of multiplicative form
EP3597772A1 (en) 2013-04-17 2020-01-22 Agency For Science, Technology And Research Method for generating extended sequence reads
EP2911075A1 (de) * 2014-02-25 2015-08-26 LTS LOHMANN Therapie-Systeme AG System zur Bestimmung einer Eignung eines Wirkstoffs für die transdermale oder transmukosale Applikation sowie entsprechendes Verfahren
SG11201703258PA (en) 2014-11-25 2017-05-30 Codexis Inc Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
WO2016105579A1 (en) * 2014-12-22 2016-06-30 Board Of Regents Of The University Of Texas System Systems and methods for processing sequence data for variant detection and analysis
LT3237621T (lt) 2014-12-22 2023-09-25 Codexis, Inc. Žmogaus alfa-galaktozidazės variantai
EP3298524A4 (en) 2015-05-22 2019-03-20 CSTS Health Care Inc. THERMODYNAMIC MEASUREMENTS RELATING TO PROTEIN-PROTEIN INTERACTION NETWORKS FOR THE TREATMENT OF CANCER
FR3047013A1 (fr) * 2016-01-22 2017-07-28 Univ Montpellier Procede de classification d'un echantillon biologique.
EP3452940A4 (en) 2016-05-04 2020-01-01 Deep Genomics Incorporated METHODS AND SYSTEMS FOR THE PRODUCTION OF AN EXTENDED EXERCISE DATA SET FOR MACHINE LEARNING WITH BIOLOGICAL SEQUENCES
SG11201809575TA (en) 2016-06-09 2018-11-29 Codexis Inc Biocatalysts and methods for hydroxylation of chemical compounds
WO2017218325A1 (en) 2016-06-15 2017-12-21 Codexis, Inc. Engineered beta-glucosidases and glucosylation methods
IL264686B1 (en) 2016-08-26 2024-03-01 Codexis Inc Engineered imine reductases and methods for reversible amination of ketone and amine compounds
US10118610B2 (en) * 2016-08-31 2018-11-06 Ford Global Technologies, Llc Autonomous vehicle using path prediction
JP2020505942A (ja) 2017-02-13 2020-02-27 コデクシス, インコーポレイテッド フェニルアラニンアンモニアリアーゼポリペプチド
CN108693787A (zh) * 2017-03-29 2018-10-23 株式会社东芝 模型构建系统以及模型构建方法
WO2019005540A1 (en) 2017-06-30 2019-01-03 Codexis, Inc. T7 POLYMERASE RNA VARIANTS
CA3066767A1 (en) 2017-06-30 2019-01-03 Codexis, Inc. T7 rna polymerase variants
CN107677997B (zh) * 2017-09-28 2021-06-29 杭州电子科技大学 基于GLMB滤波和Gibbs采样的扩展目标跟踪方法
US20190108311A1 (en) * 2017-10-06 2019-04-11 Grail, Inc. Site-specific noise model for targeted sequencing
CA3079389A1 (en) * 2017-10-17 2019-04-25 Jungla Llc Molecular evidence platform for auditable, continuous optimization of variant interpretation in genetic and genomic testing and analysis
AU2018383752A1 (en) 2017-12-13 2020-05-21 Codexis, Inc. Carboxyesterase polypeptides for amide coupling
CN108281192B (zh) * 2017-12-29 2022-03-22 一诺仪器(中国)有限公司 基于集成学习算法的人体成分预测方法及系统
JP2021532757A (ja) 2018-07-30 2021-12-02 コデクシス, インコーポレイテッド 操作されたグリコシルトランスフェラーゼおよびステビオールグリコシドのグルコシル化方法
US11398297B2 (en) * 2018-10-11 2022-07-26 Chun-Chieh Chang Systems and methods for using machine learning and DNA sequencing to extract latent information for DNA, RNA and protein sequences
AU2019358198A1 (en) * 2018-10-11 2021-05-27 Berkeley Lights, Inc. Systems and methods for identification of optimized protein production and kits therefor
KR20210084590A (ko) 2018-10-29 2021-07-07 코덱시스, 인코포레이티드 조작된 dna 중합효소 변이체
US11473077B2 (en) 2018-12-14 2022-10-18 Codexis, Inc. Engineered tyrosine ammonia lyase
WO2020132252A2 (en) 2018-12-20 2020-06-25 Codexis, Inc. Human alpha-galactosidase variants
WO2020154386A1 (en) * 2019-01-22 2020-07-30 EMULATE, Inc. High-content imaging of microfluidic devices
WO2020168286A1 (en) * 2019-02-14 2020-08-20 University Of Washington Systems and methods for improved nanopore-based analysis of nucleic acids
CN109902389B (zh) * 2019-03-01 2021-01-01 厦门大学 基于改进通用似然估计的不确定性有限元模型修正方法
CN109979539B (zh) * 2019-04-10 2020-10-02 电子科技大学 基因序列优化方法、装置及数据处理终端
KR102642718B1 (ko) 2019-05-02 2024-02-29 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 합성 단백질 안정성을 증가시키기 위한 시스템 및 방법
JP7298284B2 (ja) * 2019-05-09 2023-06-27 富士通株式会社 演算処理装置、演算処理プログラム、及び演算処理方法
EP3980901A1 (en) * 2019-06-07 2022-04-13 Leica Microsystems CMS GmbH A system and method for processing biology-related data, a system and method for controlling a microscope and a microscope
AU2020290510A1 (en) * 2019-06-12 2022-02-03 Quantum-Si Incorporated Techniques for protein identification using machine learning and related systems and methods
JP7438693B2 (ja) * 2019-09-02 2024-02-27 キヤノンメディカルシステムズ株式会社 診療支援装置
US20210174909A1 (en) * 2019-12-10 2021-06-10 Homodeus, Inc. Generative machine learning models for predicting functional protein sequences
US11188778B1 (en) * 2020-05-05 2021-11-30 Illumina, Inc. Equalization-based image processing and spatial crosstalk attenuator
CA3191867A1 (en) 2020-08-28 2022-03-03 Codexis, Inc. Engineered protease variants
KR20230145027A (ko) 2020-08-28 2023-10-17 코덱시스, 인코포레이티드 조작된 아밀라제 변이체
US11361194B2 (en) 2020-10-27 2022-06-14 Illumina, Inc. Systems and methods for per-cluster intensity correction and base calling
EP4262804A2 (en) 2020-12-18 2023-10-25 Codexis, Inc. Engineered uridine phosphorylase variant enzymes
US11439159B2 (en) 2021-03-22 2022-09-13 Shiru, Inc. System for identifying and developing individual naturally-occurring proteins as food ingredients by machine learning and database mining combined with empirical testing for a target food function
US20220325285A1 (en) 2021-04-02 2022-10-13 Codexis, Inc. ENGINEERED CYCLIC GMP-AMP SYNTHASE (cGAS) VARIANT ENZYMES
CN117222735A (zh) 2021-04-02 2023-12-12 科德克希思公司 工程化乙酸激酶变体酶
IL305919A (en) 2021-04-02 2023-11-01 Codexis Inc A transgenic enzyme variant of adenylate kinase
US20220325284A1 (en) 2021-04-02 2022-10-13 Codexis, Inc. Engineered guanylate kinase variant enzymes
US11455487B1 (en) 2021-10-26 2022-09-27 Illumina Software, Inc. Intensity extraction and crosstalk attenuation using interpolation and adaptation for base calling
CN114913939B (zh) * 2022-07-19 2022-11-15 北京科技大学 高通量平台和机器学习优化的药物组合设计方法及装置
CN116884503B (zh) * 2023-09-06 2023-12-26 北京齐碳科技有限公司 序列和后验矩阵的处理方法、装置和计算设备

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6171820B1 (en) * 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
DK1036198T3 (da) 1997-12-08 2013-01-02 California Inst Of Techn Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser
US7315786B2 (en) 1998-10-16 2008-01-01 Xencor Protein design automation for protein libraries
US20020048772A1 (en) 2000-02-10 2002-04-25 Dahiyat Bassil I. Protein design automation for protein libraries
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US20070065838A1 (en) 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
AU3210200A (en) 1999-01-19 2000-08-01 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
AU780941B2 (en) * 1999-11-22 2005-04-28 Yissum Research Development Company Of The Hebrew University Of Jerusalem System and method for searching a combinatorial space
US20010051855A1 (en) * 2000-02-17 2001-12-13 California Institute Of Technology Computationally targeted evolutionary design
AU2001241939A1 (en) 2000-02-28 2001-09-12 Maxygen, Inc. Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation
AU4964101A (en) 2000-03-30 2001-10-15 Maxygen Inc In silico cross-over site selection
EP1283877A2 (en) 2000-05-23 2003-02-19 California Institute Of Technology Gene recombination and hybrid protein development
US20030032059A1 (en) 2000-05-23 2003-02-13 Zhen-Gang Wang Gene recombination and hybrid protein development
US20020155460A1 (en) 2000-10-10 2002-10-24 Genencor International Inc. Information rich libraries
CA2487038A1 (en) * 2001-06-11 2002-12-19 Transition Therapeutics Inc. Combination therapies using vitamin b12 and therapeutic agents for treatment of viral, proliferative and inflammatory diseases
US7783428B2 (en) 2002-03-01 2010-08-24 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US20050084907A1 (en) * 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
CA2481485A1 (en) 2002-04-04 2003-10-16 Ishihara Sangyo Kaisha, Ltd. Apparatus and method for analyzing data
SG135053A1 (en) * 2002-05-20 2007-09-28 Abmaxis Inc Generation and selection of protein library in silico
JP4042492B2 (ja) 2002-08-07 2008-02-06 トヨタ自動車株式会社 エンジン制御パラメータの適合方法及び適合システム
JP2004355174A (ja) * 2003-05-28 2004-12-16 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム
AU2004280593A1 (en) * 2003-10-08 2005-04-21 Ebioscience Native immunoglobulin binding reagents and methods for making and using same
US7529714B2 (en) * 2004-12-14 2009-05-05 International Business Machines Corporation Cost management of software application portfolio
CN1763227A (zh) * 2005-09-01 2006-04-26 南京工业大学 一种提高蛋白质生物学功能的方法
EP2193146B1 (en) * 2007-09-14 2016-05-25 Adimab, LLC Rationally designed, synthetic antibody libraries and uses therefor
WO2009046445A1 (en) 2007-10-04 2009-04-09 Halcyon Molecular Sequencing nucleic acid polymers with electron microscopy
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
CN101353372A (zh) * 2008-08-04 2009-01-28 林峻 一种新型蛋白质分子定向进化方法
EP2370598B1 (en) * 2008-12-11 2017-02-15 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
US8551096B2 (en) * 2009-05-13 2013-10-08 Boston Scientific Scimed, Inc. Directional delivery of energy and bioactives
CN101792934A (zh) * 2009-08-26 2010-08-04 青岛科技大学 一种基于组合原理和pcr建立超大容量基因文库的新方法
JP5649424B2 (ja) * 2010-02-03 2015-01-07 大和ハウス工業株式会社 防水シート診断方法および診断装置
US20120115734A1 (en) * 2010-11-04 2012-05-10 Laura Potter In silico prediction of high expression gene combinations and other combinations of biological components
WO2012093483A1 (ja) 2011-01-06 2012-07-12 アクアエンタープライズ株式会社 移動過程予測システム、移動過程予測方法、移動過程予測装置及びコンピュータプログラム
US20120231447A1 (en) * 2011-02-15 2012-09-13 Howard Hughes Medical Institute Surface Passivation Methods for Single Molecule Imaging of Biochemical Reactions
CN102206625A (zh) * 2011-03-04 2011-10-05 东华大学 易错pcr/卡那霉素筛选系统定向进化蛋白质内含子
US20130017540A1 (en) * 2011-06-07 2013-01-17 Yun Yen Identification of mutation types associated with acquired resistance and methods for using same
SG11201505977RA (en) 2013-01-31 2015-08-28 Codexis Inc Methods, systems, and software for identifying bio-molecules using models of multiplicative form

Also Published As

Publication number Publication date
US20140214391A1 (en) 2014-07-31
BR112015018454A2 (pt) 2018-12-04
JP2016511884A (ja) 2016-04-21
JP6377078B2 (ja) 2018-08-22
JP2018161148A (ja) 2018-10-18
BR112015018449A2 (pt) 2019-05-14
BR112015018454B1 (pt) 2023-05-09
LT2951754T (lt) 2024-04-25
CA2899859A1 (en) 2014-08-07
WO2014120819A1 (en) 2014-08-07
JP6433028B2 (ja) 2018-12-05
KR20210005325A (ko) 2021-01-13
BR112015018449B1 (pt) 2022-05-31
AU2014212430B2 (en) 2019-06-20
WO2014120821A1 (en) 2014-08-07
RU2695146C2 (ru) 2019-07-22
CN109360608A (zh) 2019-02-19
CA2899859C (en) 2022-08-16
EP2951754B1 (en) 2024-03-20
US9665694B2 (en) 2017-05-30
JP2017189176A (ja) 2017-10-19
CN105144190B (zh) 2018-05-01
NZ710299A (en) 2020-01-31
NZ710323A (en) 2020-02-28
EP2951579B1 (en) 2024-04-24
AU2014212430A1 (en) 2015-08-06
EP2951579A1 (en) 2015-12-09
RU2015136776A (ru) 2017-03-10
JP2016504924A (ja) 2016-02-18
CN109360608B (zh) 2022-05-24
EP2951579A4 (en) 2016-09-21
SG11201505969XA (en) 2015-08-28
CN105074463B (zh) 2018-09-25
JP6655670B2 (ja) 2020-02-26
US20170204405A1 (en) 2017-07-20
AU2014212432A1 (en) 2015-08-06
KR20150113166A (ko) 2015-10-07
CA2898777A1 (en) 2014-08-07
SG11201505977RA (en) 2015-08-28
IL240055A0 (en) 2015-09-24
US9684771B2 (en) 2017-06-20
KR102215219B1 (ko) 2021-02-16
CN105144190A (zh) 2015-12-09
IL240056A0 (en) 2015-09-24
RU2664695C2 (ru) 2018-08-21
CN105074463A (zh) 2015-11-18
CA2898777C (en) 2024-01-02
DK2951754T3 (da) 2024-04-15
KR20150113167A (ko) 2015-10-07
AU2014212432B2 (en) 2019-09-19
EP2951754A4 (en) 2016-11-30
US20170211206A1 (en) 2017-07-27
US20140221216A1 (en) 2014-08-07
KR102490720B1 (ko) 2023-01-27
EP2951754A1 (en) 2015-12-09

Similar Documents

Publication Publication Date Title
RU2015136780A (ru) Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы
JP2018161148A5 (ru)
Frandsen et al. Automatic selection of partitioning schemes for phylogenetic analyses using iterative k-means clustering of site rates
Henson et al. Next-generation sequencing and large genome assemblies
Eddy Computational analysis of conserved RNA secondary structure in transcriptomes and genomes
Hedtke et al. Targeted enrichment: maximizing orthologous gene comparisons across deep evolutionary time
Kronenberg et al. FALCON-Phase: integrating PacBio and Hi-C data for phased diploid genomes
CN103473482B (zh) 基于差分进化和构象空间退火的蛋白质三维结构预测方法
Zhang et al. IsRNA1: de novo prediction and blind screening of RNA 3D structures
Xu et al. Hierarchical assembly of RNA three-dimensional structures based on loop templates
Li et al. PROBer provides a general toolkit for analyzing sequencing-based toeprinting assays
Reddy et al. MetaCAA: A clustering-aided methodology for efficient assembly of metagenomic datasets
Perumal et al. High contiguity long read assembly of Brassica nigra allows localization of active centromeres and provides insights into the ancestral Brassica genome
Vasconcelos et al. In silico identification of conserved intercoding sequences in Leishmania genomes: unraveling putative cis-regulatory elements
Gunsalus et al. In silico discovery of repetitive elements as key sequence determinants of 3D genome folding
Backofen et al. Bioinformatics of prokaryotic RNAs
Wajid et al. The A, C, G, and T of genome assembly
Whelan Species tree inference in the age of genomics
Arif et al. A combinatorial in silico approach for microRNA-target identification: Order out of chaos
Sacomoto et al. Navigating in a sea of repeats in rna-seq without drowning
CA2953675A1 (en) A method for finding associated positions of bases of a read on a reference genome
Algama et al. Drosophila 3′ UTRs are more complex than protein-coding sequences
Roberts et al. Genome-wide strand asymmetry in massively parallel reporter activity favors genic strands
John et al. Tools for sequence assembly and annotation
Chakraborty Ladder-seq partitions RNA-seq reads by length to improve transcriptome quantification and assembly