RU2015136780A - Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы - Google Patents
Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы Download PDFInfo
- Publication number
- RU2015136780A RU2015136780A RU2015136780A RU2015136780A RU2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A RU 2015136780 A RU2015136780 A RU 2015136780A
- Authority
- RU
- Russia
- Prior art keywords
- sequence
- activity
- protein
- model
- models
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/10—Design of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
Claims (91)
1. Способ проведения направленной эволюции, причем данный способ включает
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой или нуклеиновокислотной последовательности, и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одной или более мутаций для цикла направленной эволюции посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;
(d) получение множества олигонуклеотидов, содержащих или кодирующих одну или более мутаций, выбранных в (c); и
(e) осуществление цикла направленной эволюции с использованием множества олигонуклеотидов, полученных в (d).
2. Способ по п. 1, в котором выбор мутации для цикла направленной эволюции содержит идентификацию одного или более коэффициентов, которые, как определено, больше, чем другие коэффициенты, и выбор определенной аминокислоты или нуклеотида в определенном положении, представляемых одним или более коэффициентами, идентифицированными таким образом.
3. Способ по любому из предшествующих пунктов, в котором получение множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c), содержит синтезирование олигонуклеотидов с помощью синтезатора нуклеиновых кислот.
4. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит фрагментирование и рекомбинирование белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.
5. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит осуществление насыщающего мутагенеза в отношении белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.
6. Способ проведения направленной эволюции, причем данный способ включает:
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одной или более мутаций посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;
(d) идентифицирование новой белковой или новой нуклеиновокислотной последовательности, содержащей одну или более мутаций, выбранных в (c); и
(e) получение и анализирование нового белка или белка, кодируемого новой нуклеиновокислотной последовательностью.
7. Способ по п. 6, дополнительно содержащий использование новой белковой или новой нуклеиновокислотной последовательности,
идентифицированной в (d), в качестве исходной точки для дальнейшей направленной эволюции.
8. Способ по п. 6, дополнительно содержащий проведение насыщающего мутагенеза в одном или более положениях мутаций, выбранных в (c).
9. Способ проведения направленной эволюции, причем данный способ включает,
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) выбор одного или более положений в белковой последовательности или нуклеиновокислотной последовательности посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность; и
(d) проведение насыщающего мутагенеза в одном или более положениях, идентифицированных в (c).
10. Способ проведения направленной эволюции, причем данный способ включает,
(a) получение данных о последовательности и активности для каждого из множества вариантов белков;
(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-
активность содержит:
произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и
зависимую переменную, представляющую активность вариантов белков;
(c) использование множественных белковых последовательностей или множественных аминокислотных последовательностей в модели последовательность-активность и определение значений активности, предсказанных моделью последовательность-активность для каждой из множественных белковых последовательностей или нуклеиновокислотных последовательностей;
(d) выбор новой белковой последовательности или новой нуклеиновокислотной последовательности из множественных белковых последовательностей или множественных аминокислотных последовательностей, использованных в (c), посредством оценивания значений активности, предсказанных моделью последовательность-активность для данных множественных последовательностей; и
(e) получение и анализирование белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью.
11. Способ по п. 10, в котором получение белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью, содержит синтезирование нового белка или новой нуклеиновокислотной последовательности.
12. Способ по любому из пп. 1, 6, 9 и 10, в котором каждый из членов, содержащих коэффициенты, содержит произведение коэффициента и независимой переменной, причем коэффициент, представляет вклад в активность определенной аминокислоты или нуклеотида в определенном положении, и независимая переменная представляет присутствие или отсутствие определенной
аминокислоты или нуклеотида в определенном положении для соответствующего коэффициента.
13. Способ по п. 12, в котором каждый из членов, содержащих коэффициенты, представлен в форме (1 + коэффициент × независимая переменная).
14. Способ по любому из пп. 1, 6, 9 и 10, в котором коэффициенты представлены в таблице соответствия.
15. Способ по любому из пп. 1, 6, 9 и 10, в котором модель последовательность-активность содержит зависимость между зависимой переменной, представляющей активность вариантов белков, и произведением множественных членов.
16. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит перетасовку множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c).
17. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит формирование библиотеки белковых вариантов.
18. Способ по п. 17, дополнительно содержащий анализирование активности и секвенирование членов библиотеки белковых вариантов.
19. Способ по п. 18, дополнительно содержащий использование информации об активности и последовательности для библиотеки белковых вариантов для генерации и использования новой модели последовательность-активность посредством осуществления операций (b)-(e) в отношении информации об активности и последовательности для библиотеки белковых вариантов.
20. Способ по любому из пп. 1, 6, 9 и 10, в котором по меньшей мере один из более членов модели последовательность-активность содержит коэффициент взаимодействия, представляющий вклад в активность определенной комбинации (i) первой аминокислоты или нуклеотида в первом положении в последовательности и (ii) второй аминокислоты или нуклеотида во втором положении в последовательности, и
в котором коэффициент взаимодействия представляет вклад в
активность упомянутой определенной комбинации.
21. Способ по любому из п. 21, в котором генерация модели последовательность-активность содержит осуществление пошагового добавления или удаления членов, содержащих коэффициенты взаимодействия.
22. Способ по п. 20, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для выбора одного или более членов, содержащих коэффициенты взаимодействия.
23. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для уточнения значений коэффициентов.
24. Способ по п. 22, в котором генерация модели последовательность-активность содержит;
(i) получение поколения моделей, причем каждое содержит произведение множественных членов и зависимой переменной, как изложено в (b);
(ii) использование каждой из моделей в поколении моделей для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;
(iii) выбор одной или более моделей из поколения моделей на основании способности моделей точно предсказывать активность множества вариантов белков;
(iv) модифицирование выбранных одной или более моделей для получения следующего поколения моделей; и
(v) многократное повторение (ii)-(iv) со следующим поколением моделей для генерации модели последовательность-активность (b).
25. Способ по п. 23, в котором генерация модели последовательность-активность содержит;
(i) получение поколения моделей, причем каждое содержит произведение множественных членов и зависимой переменной, как изложено в (b);
(ii) использование каждой из моделей в поколении моделей
для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;
(iii) выбор одной или более моделей из поколения моделей на основании способности моделей точно предсказывать активность множества вариантов белков;
(iv) модифицирование выбранных одной или более моделей для получения следующего поколения моделей; и
(v) многократное повторение (ii)-(iv) со следующим поколением моделей для генерации модели последовательность-активность (b).
26. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование априорной информации для определения апостериорных распределений вероятностей модели.
27. Способ по любому из пп. 1, 6, 9 и 10, дополнительно содержащий генерацию ансамбля моделей последовательность-активность, причем каждая имеет форму, приведенную в (b).
28. Способ по п. 27, дополнительно содержащий генерацию ансамблевой модели, включающей члены из двух или более моделей последовательность-активность, причем данные члены ансамблевой модели взвешены по способности данных двух или более моделей предсказывать активность.
29. Способ по п. 27, дополнительно содержащий использование ансамблевой модели для выбора мутаций для цикла направленной эволюции.
30. Способ проведения направленной эволюции биологических молекул, причем данный способ включает,
(a) получение данных о последовательности и активности для множества биологических молекул, причем каждая биологическая молекула содержит последовательность, содержащую субъединицы различных типов и положений в последовательности;
(b) построение модели последовательность-активность по полученным данным, причем
модель последовательность-активность предсказывает активность как функцию типа субъединиц и положения субъединиц в
последовательности,
модель последовательность-активность содержит произведение множества основных мультипликативных членов, причем каждый из основных мультипликативных членов содержит (1) фиктивную переменную, представляющую присутствие/отсутствие определенной субъединицы конкретного типа в конкретном положении в последовательности, и (2) коэффициент, представляющий вклад определенной субъединицы в активность; и
(c) использование модели последовательность-активность, для того чтобы идентифицировать одну или более субъединиц конкретных типов в конкретных положениях для вариации для воздействия на желаемую активность биологических молекул.
31. Способ по п. 30, в котором последовательность представляет собой весь геном, целую хромосому, сегмент хромосомы, коллекцию последовательностей генов взаимодействующих генов, ген, белок или полисахарид или любую их комбинацию.
32. Способ по п. 30, в котором субъединица представляет собой хромосому, сегмент хромосомы, гаплотип, ген, кодон, мутацию, нуклеотид, аминокислоту, моносахарид, липид или любую их комбинацию.
33. Компьютерная система, содержащая:
один или более процессоров;
системную память; и
одну или более читаемых компьютером сред для хранения, несущих сохраненные на них выполнимые компьютером инструкции, которые, когда выполняются одним или более процессорами, вынуждают компьютерную систему осуществлять способ проведения направленной эволюции биологических молекул, причем данный способ включает:
(a) получение данных о последовательности и активности для множества биологических молекул, причем каждая биологическая молекула содержит последовательность, содержащую субъединицы различных типов и положений в последовательности;
(b) построение модели последовательность-активность по полученным данным, причем
модель последовательность-активность предсказывает
активность как функцию типа субъединиц и положения субъединиц в последовательности,
модель последовательность-активность содержит произведение множества основных мультипликативных членов, причем каждый из основных мультипликативных членов содержит (1) фиктивную переменную, представляющую присутствие/отсутствие определенной субъединицы конкретного типа в конкретном положении в последовательности, и (2) коэффициент, представляющий вклад определенной субъединицы в активность; и
(c) использование модели последовательность-активность, для того чтобы идентифицировать одну или более субъединиц конкретных типов в конкретных положениях для вариации для воздействия на желаемую активность биологических молекул.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361759276P | 2013-01-31 | 2013-01-31 | |
US61/759,276 | 2013-01-31 | ||
US201361799377P | 2013-03-15 | 2013-03-15 | |
US61/799,377 | 2013-03-15 | ||
PCT/US2014/013668 WO2014120821A1 (en) | 2013-01-31 | 2014-01-29 | Methods, systems, and software for identifying bio-molecules using models of multiplicative form |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2015136780A true RU2015136780A (ru) | 2017-03-10 |
RU2664695C2 RU2664695C2 (ru) | 2018-08-21 |
Family
ID=51223867
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015136776A RU2695146C2 (ru) | 2013-01-31 | 2014-01-29 | Способы, системы и программное обеспечение для идентификации биомолекул со взаимодействующими компонентами |
RU2015136780A RU2664695C2 (ru) | 2013-01-31 | 2014-01-29 | Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015136776A RU2695146C2 (ru) | 2013-01-31 | 2014-01-29 | Способы, системы и программное обеспечение для идентификации биомолекул со взаимодействующими компонентами |
Country Status (15)
Country | Link |
---|---|
US (4) | US9684771B2 (ru) |
EP (2) | EP2951754B1 (ru) |
JP (4) | JP6433028B2 (ru) |
KR (3) | KR20150113166A (ru) |
CN (3) | CN109360608B (ru) |
AU (2) | AU2014212430B2 (ru) |
BR (2) | BR112015018454B1 (ru) |
CA (2) | CA2898777C (ru) |
DK (1) | DK2951754T3 (ru) |
IL (2) | IL240056A0 (ru) |
LT (1) | LT2951754T (ru) |
NZ (2) | NZ710299A (ru) |
RU (2) | RU2695146C2 (ru) |
SG (2) | SG11201505977RA (ru) |
WO (2) | WO2014120819A1 (ru) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201505977RA (en) | 2013-01-31 | 2015-08-28 | Codexis Inc | Methods, systems, and software for identifying bio-molecules using models of multiplicative form |
EP3597772A1 (en) | 2013-04-17 | 2020-01-22 | Agency For Science, Technology And Research | Method for generating extended sequence reads |
EP2911075A1 (de) * | 2014-02-25 | 2015-08-26 | LTS LOHMANN Therapie-Systeme AG | System zur Bestimmung einer Eignung eines Wirkstoffs für die transdermale oder transmukosale Applikation sowie entsprechendes Verfahren |
SG11201703258PA (en) | 2014-11-25 | 2017-05-30 | Codexis Inc | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds |
WO2016105579A1 (en) * | 2014-12-22 | 2016-06-30 | Board Of Regents Of The University Of Texas System | Systems and methods for processing sequence data for variant detection and analysis |
LT3237621T (lt) | 2014-12-22 | 2023-09-25 | Codexis, Inc. | Žmogaus alfa-galaktozidazės variantai |
EP3298524A4 (en) | 2015-05-22 | 2019-03-20 | CSTS Health Care Inc. | THERMODYNAMIC MEASUREMENTS RELATING TO PROTEIN-PROTEIN INTERACTION NETWORKS FOR THE TREATMENT OF CANCER |
FR3047013A1 (fr) * | 2016-01-22 | 2017-07-28 | Univ Montpellier | Procede de classification d'un echantillon biologique. |
EP3452940A4 (en) | 2016-05-04 | 2020-01-01 | Deep Genomics Incorporated | METHODS AND SYSTEMS FOR THE PRODUCTION OF AN EXTENDED EXERCISE DATA SET FOR MACHINE LEARNING WITH BIOLOGICAL SEQUENCES |
SG11201809575TA (en) | 2016-06-09 | 2018-11-29 | Codexis Inc | Biocatalysts and methods for hydroxylation of chemical compounds |
WO2017218325A1 (en) | 2016-06-15 | 2017-12-21 | Codexis, Inc. | Engineered beta-glucosidases and glucosylation methods |
IL264686B1 (en) | 2016-08-26 | 2024-03-01 | Codexis Inc | Engineered imine reductases and methods for reversible amination of ketone and amine compounds |
US10118610B2 (en) * | 2016-08-31 | 2018-11-06 | Ford Global Technologies, Llc | Autonomous vehicle using path prediction |
JP2020505942A (ja) | 2017-02-13 | 2020-02-27 | コデクシス, インコーポレイテッド | フェニルアラニンアンモニアリアーゼポリペプチド |
CN108693787A (zh) * | 2017-03-29 | 2018-10-23 | 株式会社东芝 | 模型构建系统以及模型构建方法 |
WO2019005540A1 (en) | 2017-06-30 | 2019-01-03 | Codexis, Inc. | T7 POLYMERASE RNA VARIANTS |
CA3066767A1 (en) | 2017-06-30 | 2019-01-03 | Codexis, Inc. | T7 rna polymerase variants |
CN107677997B (zh) * | 2017-09-28 | 2021-06-29 | 杭州电子科技大学 | 基于GLMB滤波和Gibbs采样的扩展目标跟踪方法 |
US20190108311A1 (en) * | 2017-10-06 | 2019-04-11 | Grail, Inc. | Site-specific noise model for targeted sequencing |
CA3079389A1 (en) * | 2017-10-17 | 2019-04-25 | Jungla Llc | Molecular evidence platform for auditable, continuous optimization of variant interpretation in genetic and genomic testing and analysis |
AU2018383752A1 (en) | 2017-12-13 | 2020-05-21 | Codexis, Inc. | Carboxyesterase polypeptides for amide coupling |
CN108281192B (zh) * | 2017-12-29 | 2022-03-22 | 一诺仪器(中国)有限公司 | 基于集成学习算法的人体成分预测方法及系统 |
JP2021532757A (ja) | 2018-07-30 | 2021-12-02 | コデクシス, インコーポレイテッド | 操作されたグリコシルトランスフェラーゼおよびステビオールグリコシドのグルコシル化方法 |
US11398297B2 (en) * | 2018-10-11 | 2022-07-26 | Chun-Chieh Chang | Systems and methods for using machine learning and DNA sequencing to extract latent information for DNA, RNA and protein sequences |
AU2019358198A1 (en) * | 2018-10-11 | 2021-05-27 | Berkeley Lights, Inc. | Systems and methods for identification of optimized protein production and kits therefor |
KR20210084590A (ko) | 2018-10-29 | 2021-07-07 | 코덱시스, 인코포레이티드 | 조작된 dna 중합효소 변이체 |
US11473077B2 (en) | 2018-12-14 | 2022-10-18 | Codexis, Inc. | Engineered tyrosine ammonia lyase |
WO2020132252A2 (en) | 2018-12-20 | 2020-06-25 | Codexis, Inc. | Human alpha-galactosidase variants |
WO2020154386A1 (en) * | 2019-01-22 | 2020-07-30 | EMULATE, Inc. | High-content imaging of microfluidic devices |
WO2020168286A1 (en) * | 2019-02-14 | 2020-08-20 | University Of Washington | Systems and methods for improved nanopore-based analysis of nucleic acids |
CN109902389B (zh) * | 2019-03-01 | 2021-01-01 | 厦门大学 | 基于改进通用似然估计的不确定性有限元模型修正方法 |
CN109979539B (zh) * | 2019-04-10 | 2020-10-02 | 电子科技大学 | 基因序列优化方法、装置及数据处理终端 |
KR102642718B1 (ko) | 2019-05-02 | 2024-02-29 | 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 | 합성 단백질 안정성을 증가시키기 위한 시스템 및 방법 |
JP7298284B2 (ja) * | 2019-05-09 | 2023-06-27 | 富士通株式会社 | 演算処理装置、演算処理プログラム、及び演算処理方法 |
EP3980901A1 (en) * | 2019-06-07 | 2022-04-13 | Leica Microsystems CMS GmbH | A system and method for processing biology-related data, a system and method for controlling a microscope and a microscope |
AU2020290510A1 (en) * | 2019-06-12 | 2022-02-03 | Quantum-Si Incorporated | Techniques for protein identification using machine learning and related systems and methods |
JP7438693B2 (ja) * | 2019-09-02 | 2024-02-27 | キヤノンメディカルシステムズ株式会社 | 診療支援装置 |
US20210174909A1 (en) * | 2019-12-10 | 2021-06-10 | Homodeus, Inc. | Generative machine learning models for predicting functional protein sequences |
US11188778B1 (en) * | 2020-05-05 | 2021-11-30 | Illumina, Inc. | Equalization-based image processing and spatial crosstalk attenuator |
CA3191867A1 (en) | 2020-08-28 | 2022-03-03 | Codexis, Inc. | Engineered protease variants |
KR20230145027A (ko) | 2020-08-28 | 2023-10-17 | 코덱시스, 인코포레이티드 | 조작된 아밀라제 변이체 |
US11361194B2 (en) | 2020-10-27 | 2022-06-14 | Illumina, Inc. | Systems and methods for per-cluster intensity correction and base calling |
EP4262804A2 (en) | 2020-12-18 | 2023-10-25 | Codexis, Inc. | Engineered uridine phosphorylase variant enzymes |
US11439159B2 (en) | 2021-03-22 | 2022-09-13 | Shiru, Inc. | System for identifying and developing individual naturally-occurring proteins as food ingredients by machine learning and database mining combined with empirical testing for a target food function |
US20220325285A1 (en) | 2021-04-02 | 2022-10-13 | Codexis, Inc. | ENGINEERED CYCLIC GMP-AMP SYNTHASE (cGAS) VARIANT ENZYMES |
CN117222735A (zh) | 2021-04-02 | 2023-12-12 | 科德克希思公司 | 工程化乙酸激酶变体酶 |
IL305919A (en) | 2021-04-02 | 2023-11-01 | Codexis Inc | A transgenic enzyme variant of adenylate kinase |
US20220325284A1 (en) | 2021-04-02 | 2022-10-13 | Codexis, Inc. | Engineered guanylate kinase variant enzymes |
US11455487B1 (en) | 2021-10-26 | 2022-09-27 | Illumina Software, Inc. | Intensity extraction and crosstalk attenuation using interpolation and adaptation for base calling |
CN114913939B (zh) * | 2022-07-19 | 2022-11-15 | 北京科技大学 | 高通量平台和机器学习优化的药物组合设计方法及装置 |
CN116884503B (zh) * | 2023-09-06 | 2023-12-26 | 北京齐碳科技有限公司 | 序列和后验矩阵的处理方法、装置和计算设备 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6171820B1 (en) * | 1995-12-07 | 2001-01-09 | Diversa Corporation | Saturation mutagenesis in directed evolution |
US6537776B1 (en) | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
US6153410A (en) | 1997-03-25 | 2000-11-28 | California Institute Of Technology | Recombination of polynucleotide sequences using random or defined primers |
DK1036198T3 (da) | 1997-12-08 | 2013-01-02 | California Inst Of Techn | Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser |
US7315786B2 (en) | 1998-10-16 | 2008-01-01 | Xencor | Protein design automation for protein libraries |
US20020048772A1 (en) | 2000-02-10 | 2002-04-25 | Dahiyat Bassil I. | Protein design automation for protein libraries |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
AU3210200A (en) | 1999-01-19 | 2000-08-01 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
AU780941B2 (en) * | 1999-11-22 | 2005-04-28 | Yissum Research Development Company Of The Hebrew University Of Jerusalem | System and method for searching a combinatorial space |
US20010051855A1 (en) * | 2000-02-17 | 2001-12-13 | California Institute Of Technology | Computationally targeted evolutionary design |
AU2001241939A1 (en) | 2000-02-28 | 2001-09-12 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
AU4964101A (en) | 2000-03-30 | 2001-10-15 | Maxygen Inc | In silico cross-over site selection |
EP1283877A2 (en) | 2000-05-23 | 2003-02-19 | California Institute Of Technology | Gene recombination and hybrid protein development |
US20030032059A1 (en) | 2000-05-23 | 2003-02-13 | Zhen-Gang Wang | Gene recombination and hybrid protein development |
US20020155460A1 (en) | 2000-10-10 | 2002-10-24 | Genencor International Inc. | Information rich libraries |
CA2487038A1 (en) * | 2001-06-11 | 2002-12-19 | Transition Therapeutics Inc. | Combination therapies using vitamin b12 and therapeutic agents for treatment of viral, proliferative and inflammatory diseases |
US7783428B2 (en) | 2002-03-01 | 2010-08-24 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20050084907A1 (en) * | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
CA2481485A1 (en) | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Apparatus and method for analyzing data |
SG135053A1 (en) * | 2002-05-20 | 2007-09-28 | Abmaxis Inc | Generation and selection of protein library in silico |
JP4042492B2 (ja) | 2002-08-07 | 2008-02-06 | トヨタ自動車株式会社 | エンジン制御パラメータの適合方法及び適合システム |
JP2004355174A (ja) * | 2003-05-28 | 2004-12-16 | Ishihara Sangyo Kaisha Ltd | データ解析方法及びそのシステム |
AU2004280593A1 (en) * | 2003-10-08 | 2005-04-21 | Ebioscience | Native immunoglobulin binding reagents and methods for making and using same |
US7529714B2 (en) * | 2004-12-14 | 2009-05-05 | International Business Machines Corporation | Cost management of software application portfolio |
CN1763227A (zh) * | 2005-09-01 | 2006-04-26 | 南京工业大学 | 一种提高蛋白质生物学功能的方法 |
EP2193146B1 (en) * | 2007-09-14 | 2016-05-25 | Adimab, LLC | Rationally designed, synthetic antibody libraries and uses therefor |
WO2009046445A1 (en) | 2007-10-04 | 2009-04-09 | Halcyon Molecular | Sequencing nucleic acid polymers with electron microscopy |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
CN101353372A (zh) * | 2008-08-04 | 2009-01-28 | 林峻 | 一种新型蛋白质分子定向进化方法 |
EP2370598B1 (en) * | 2008-12-11 | 2017-02-15 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
US8551096B2 (en) * | 2009-05-13 | 2013-10-08 | Boston Scientific Scimed, Inc. | Directional delivery of energy and bioactives |
CN101792934A (zh) * | 2009-08-26 | 2010-08-04 | 青岛科技大学 | 一种基于组合原理和pcr建立超大容量基因文库的新方法 |
JP5649424B2 (ja) * | 2010-02-03 | 2015-01-07 | 大和ハウス工業株式会社 | 防水シート診断方法および診断装置 |
US20120115734A1 (en) * | 2010-11-04 | 2012-05-10 | Laura Potter | In silico prediction of high expression gene combinations and other combinations of biological components |
WO2012093483A1 (ja) | 2011-01-06 | 2012-07-12 | アクアエンタープライズ株式会社 | 移動過程予測システム、移動過程予測方法、移動過程予測装置及びコンピュータプログラム |
US20120231447A1 (en) * | 2011-02-15 | 2012-09-13 | Howard Hughes Medical Institute | Surface Passivation Methods for Single Molecule Imaging of Biochemical Reactions |
CN102206625A (zh) * | 2011-03-04 | 2011-10-05 | 东华大学 | 易错pcr/卡那霉素筛选系统定向进化蛋白质内含子 |
US20130017540A1 (en) * | 2011-06-07 | 2013-01-17 | Yun Yen | Identification of mutation types associated with acquired resistance and methods for using same |
SG11201505977RA (en) | 2013-01-31 | 2015-08-28 | Codexis Inc | Methods, systems, and software for identifying bio-molecules using models of multiplicative form |
-
2014
- 2014-01-29 SG SG11201505977RA patent/SG11201505977RA/en unknown
- 2014-01-29 LT LTEPPCT/US2014/013666T patent/LT2951754T/lt unknown
- 2014-01-29 US US14/167,713 patent/US9684771B2/en active Active
- 2014-01-29 CA CA2898777A patent/CA2898777C/en active Active
- 2014-01-29 EP EP14746677.5A patent/EP2951754B1/en active Active
- 2014-01-29 SG SG11201505969XA patent/SG11201505969XA/en unknown
- 2014-01-29 BR BR112015018454-5A patent/BR112015018454B1/pt active IP Right Grant
- 2014-01-29 RU RU2015136776A patent/RU2695146C2/ru active
- 2014-01-29 WO PCT/US2014/013666 patent/WO2014120819A1/en active Application Filing
- 2014-01-29 WO PCT/US2014/013668 patent/WO2014120821A1/en active Application Filing
- 2014-01-29 EP EP14746406.9A patent/EP2951579B1/en active Active
- 2014-01-29 BR BR112015018449-9A patent/BR112015018449B1/pt active IP Right Grant
- 2014-01-29 RU RU2015136780A patent/RU2664695C2/ru active
- 2014-01-29 CN CN201811237910.6A patent/CN109360608B/zh active Active
- 2014-01-29 KR KR1020157023727A patent/KR20150113166A/ko active Application Filing
- 2014-01-29 JP JP2015556114A patent/JP6433028B2/ja active Active
- 2014-01-29 NZ NZ710299A patent/NZ710299A/en unknown
- 2014-01-29 JP JP2015556112A patent/JP6377078B2/ja active Active
- 2014-01-29 CN CN201480019389.2A patent/CN105074463B/zh active Active
- 2014-01-29 AU AU2014212430A patent/AU2014212430B2/en active Active
- 2014-01-29 CA CA2899859A patent/CA2899859C/en active Active
- 2014-01-29 DK DK14746677.5T patent/DK2951754T3/da active
- 2014-01-29 CN CN201480018421.5A patent/CN105144190B/zh active Active
- 2014-01-29 US US14/167,709 patent/US9665694B2/en active Active
- 2014-01-29 KR KR1020157023739A patent/KR102215219B1/ko active IP Right Grant
- 2014-01-29 AU AU2014212432A patent/AU2014212432B2/en active Active
- 2014-01-29 NZ NZ710323A patent/NZ710323A/en unknown
- 2014-01-29 KR KR1020217000247A patent/KR102490720B1/ko active IP Right Grant
-
2015
- 2015-07-21 IL IL240056A patent/IL240056A0/en active IP Right Grant
- 2015-07-21 IL IL240055A patent/IL240055A0/en active IP Right Grant
-
2017
- 2017-04-04 US US15/479,220 patent/US20170211206A1/en not_active Abandoned
- 2017-04-04 US US15/479,222 patent/US20170204405A1/en not_active Abandoned
- 2017-07-20 JP JP2017140863A patent/JP2017189176A/ja not_active Withdrawn
-
2018
- 2018-07-13 JP JP2018133041A patent/JP6655670B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2015136780A (ru) | Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы | |
JP2018161148A5 (ru) | ||
Frandsen et al. | Automatic selection of partitioning schemes for phylogenetic analyses using iterative k-means clustering of site rates | |
Henson et al. | Next-generation sequencing and large genome assemblies | |
Eddy | Computational analysis of conserved RNA secondary structure in transcriptomes and genomes | |
Hedtke et al. | Targeted enrichment: maximizing orthologous gene comparisons across deep evolutionary time | |
Kronenberg et al. | FALCON-Phase: integrating PacBio and Hi-C data for phased diploid genomes | |
CN103473482B (zh) | 基于差分进化和构象空间退火的蛋白质三维结构预测方法 | |
Zhang et al. | IsRNA1: de novo prediction and blind screening of RNA 3D structures | |
Xu et al. | Hierarchical assembly of RNA three-dimensional structures based on loop templates | |
Li et al. | PROBer provides a general toolkit for analyzing sequencing-based toeprinting assays | |
Reddy et al. | MetaCAA: A clustering-aided methodology for efficient assembly of metagenomic datasets | |
Perumal et al. | High contiguity long read assembly of Brassica nigra allows localization of active centromeres and provides insights into the ancestral Brassica genome | |
Vasconcelos et al. | In silico identification of conserved intercoding sequences in Leishmania genomes: unraveling putative cis-regulatory elements | |
Gunsalus et al. | In silico discovery of repetitive elements as key sequence determinants of 3D genome folding | |
Backofen et al. | Bioinformatics of prokaryotic RNAs | |
Wajid et al. | The A, C, G, and T of genome assembly | |
Whelan | Species tree inference in the age of genomics | |
Arif et al. | A combinatorial in silico approach for microRNA-target identification: Order out of chaos | |
Sacomoto et al. | Navigating in a sea of repeats in rna-seq without drowning | |
CA2953675A1 (en) | A method for finding associated positions of bases of a read on a reference genome | |
Algama et al. | Drosophila 3′ UTRs are more complex than protein-coding sequences | |
Roberts et al. | Genome-wide strand asymmetry in massively parallel reporter activity favors genic strands | |
John et al. | Tools for sequence assembly and annotation | |
Chakraborty | Ladder-seq partitions RNA-seq reads by length to improve transcriptome quantification and assembly |