RU2015136780A

RU2015136780A - Способы, системы и программное обеспечение для идентификации биомолекул с помощью моделей мультипликативной формы

Info

Publication number: RU2015136780A
Application number: RU2015136780A
Authority: RU
Inventors: Грегори Аллан КОУП; Николас Джон АГАРД
Original assignee: Кодексис, Инк.
Priority date: 2013-01-31
Filing date: 2014-01-29
Publication date: 2017-03-10
Also published as: US20140214391A1; BR112015018454A2; JP2016511884A; JP6377078B2; JP2018161148A; BR112015018449A2; BR112015018454B1; LT2951754T; CA2899859A1; WO2014120819A1; JP6433028B2; KR20210005325A; BR112015018449B1; AU2014212430B2; WO2014120821A1; RU2695146C2; CN109360608A; CA2899859C; EP2951754B1; US9665694B2

Claims

1. Способ проведения направленной эволюции, причем данный способ включает

(a) получение данных о последовательности и активности для каждого из множества вариантов белков;

(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-активность содержит:

произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой или нуклеиновокислотной последовательности, и

зависимую переменную, представляющую активность вариантов белков;

(c) выбор одной или более мутаций для цикла направленной эволюции посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;

(d) получение множества олигонуклеотидов, содержащих или кодирующих одну или более мутаций, выбранных в (c); и

(e) осуществление цикла направленной эволюции с использованием множества олигонуклеотидов, полученных в (d).

2. Способ по п. 1, в котором выбор мутации для цикла направленной эволюции содержит идентификацию одного или более коэффициентов, которые, как определено, больше, чем другие коэффициенты, и выбор определенной аминокислоты или нуклеотида в определенном положении, представляемых одним или более коэффициентами, идентифицированными таким образом.

3. Способ по любому из предшествующих пунктов, в котором получение множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c), содержит синтезирование олигонуклеотидов с помощью синтезатора нуклеиновых кислот.

4. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит фрагментирование и рекомбинирование белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.

5. Способ по п. 1 или 2, в котором осуществление цикла направленной эволюции содержит осуществление насыщающего мутагенеза в отношении белковой последовательности, о которой модель предсказывает, что она имеет желаемый уровень активности.

6. Способ проведения направленной эволюции, причем данный способ включает:

произведение множественных членов, причем каждый из по меньшей мере некоторых из этих членов содержит коэффициент, представляющий вклад в активность определенной аминокислоты или нуклеотида в определенном положении в белковой последовательности или нуклеиновокислотной последовательности, кодирующей белковую последовательность; и

(c) выбор одной или более мутаций посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность;

(d) идентифицирование новой белковой или новой нуклеиновокислотной последовательности, содержащей одну или более мутаций, выбранных в (c); и

(e) получение и анализирование нового белка или белка, кодируемого новой нуклеиновокислотной последовательностью.

7. Способ по п. 6, дополнительно содержащий использование новой белковой или новой нуклеиновокислотной последовательности,

идентифицированной в (d), в качестве исходной точки для дальнейшей направленной эволюции.

8. Способ по п. 6, дополнительно содержащий проведение насыщающего мутагенеза в одном или более положениях мутаций, выбранных в (c).

9. Способ проведения направленной эволюции, причем данный способ включает,

(c) выбор одного или более положений в белковой последовательности или нуклеиновокислотной последовательности посредством оценивания коэффициентов членов модели последовательность-активность для идентификации одной или более из определенных аминокислот или нуклеотидов в определенных положениях, которые вносят вклад в активность; и

(d) проведение насыщающего мутагенеза в одном или более положениях, идентифицированных в (c).

10. Способ проведения направленной эволюции, причем данный способ включает,

(b) генерацию модели последовательность-активность по данным о последовательности и активности для каждого из множества вариантов белков, причем модель последовательность-

активность содержит:

(c) использование множественных белковых последовательностей или множественных аминокислотных последовательностей в модели последовательность-активность и определение значений активности, предсказанных моделью последовательность-активность для каждой из множественных белковых последовательностей или нуклеиновокислотных последовательностей;

(d) выбор новой белковой последовательности или новой нуклеиновокислотной последовательности из множественных белковых последовательностей или множественных аминокислотных последовательностей, использованных в (c), посредством оценивания значений активности, предсказанных моделью последовательность-активность для данных множественных последовательностей; и

(e) получение и анализирование белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью.

11. Способ по п. 10, в котором получение белка, имеющего новую белковую последовательность, или белка, кодируемого новой нуклеиновокислотной последовательностью, содержит синтезирование нового белка или новой нуклеиновокислотной последовательности.

12. Способ по любому из пп. 1, 6, 9 и 10, в котором каждый из членов, содержащих коэффициенты, содержит произведение коэффициента и независимой переменной, причем коэффициент, представляет вклад в активность определенной аминокислоты или нуклеотида в определенном положении, и независимая переменная представляет присутствие или отсутствие определенной

аминокислоты или нуклеотида в определенном положении для соответствующего коэффициента.

13. Способ по п. 12, в котором каждый из членов, содержащих коэффициенты, представлен в форме (1 + коэффициент × независимая переменная).

14. Способ по любому из пп. 1, 6, 9 и 10, в котором коэффициенты представлены в таблице соответствия.

15. Способ по любому из пп. 1, 6, 9 и 10, в котором модель последовательность-активность содержит зависимость между зависимой переменной, представляющей активность вариантов белков, и произведением множественных членов.

16. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит перетасовку множества олигонуклеотидов, содержащих или кодирующих мутации, выбранные в (c).

17. Способ по любому из пп. 1, 6, 9 и 10, в котором осуществление цикла направленной эволюции содержит формирование библиотеки белковых вариантов.

18. Способ по п. 17, дополнительно содержащий анализирование активности и секвенирование членов библиотеки белковых вариантов.

19. Способ по п. 18, дополнительно содержащий использование информации об активности и последовательности для библиотеки белковых вариантов для генерации и использования новой модели последовательность-активность посредством осуществления операций (b)-(e) в отношении информации об активности и последовательности для библиотеки белковых вариантов.

20. Способ по любому из пп. 1, 6, 9 и 10, в котором по меньшей мере один из более членов модели последовательность-активность содержит коэффициент взаимодействия, представляющий вклад в активность определенной комбинации (i) первой аминокислоты или нуклеотида в первом положении в последовательности и (ii) второй аминокислоты или нуклеотида во втором положении в последовательности, и

в котором коэффициент взаимодействия представляет вклад в

активность упомянутой определенной комбинации.

21. Способ по любому из п. 21, в котором генерация модели последовательность-активность содержит осуществление пошагового добавления или удаления членов, содержащих коэффициенты взаимодействия.

22. Способ по п. 20, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для выбора одного или более членов, содержащих коэффициенты взаимодействия.

23. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование генетического алгоритма для уточнения значений коэффициентов.

24. Способ по п. 22, в котором генерация модели последовательность-активность содержит;

(i) получение поколения моделей, причем каждое содержит произведение множественных членов и зависимой переменной, как изложено в (b);

(ii) использование каждой из моделей в поколении моделей для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;

(iii) выбор одной или более моделей из поколения моделей на основании способности моделей точно предсказывать активность множества вариантов белков;

(iv) модифицирование выбранных одной или более моделей для получения следующего поколения моделей; и

(v) многократное повторение (ii)-(iv) со следующим поколением моделей для генерации модели последовательность-активность (b).

25. Способ по п. 23, в котором генерация модели последовательность-активность содержит;

(ii) использование каждой из моделей в поколении моделей

для предсказания активности по меньшей мере некоторых из множества вариантов белков с использованием последовательностей вариантов белков;

26. Способ по любому из пп. 1, 6, 9 и 10, в котором генерация модели последовательность-активность содержит использование априорной информации для определения апостериорных распределений вероятностей модели.

27. Способ по любому из пп. 1, 6, 9 и 10, дополнительно содержащий генерацию ансамбля моделей последовательность-активность, причем каждая имеет форму, приведенную в (b).

28. Способ по п. 27, дополнительно содержащий генерацию ансамблевой модели, включающей члены из двух или более моделей последовательность-активность, причем данные члены ансамблевой модели взвешены по способности данных двух или более моделей предсказывать активность.

29. Способ по п. 27, дополнительно содержащий использование ансамблевой модели для выбора мутаций для цикла направленной эволюции.

30. Способ проведения направленной эволюции биологических молекул, причем данный способ включает,

(a) получение данных о последовательности и активности для множества биологических молекул, причем каждая биологическая молекула содержит последовательность, содержащую субъединицы различных типов и положений в последовательности;

(b) построение модели последовательность-активность по полученным данным, причем

модель последовательность-активность предсказывает активность как функцию типа субъединиц и положения субъединиц в

последовательности,

модель последовательность-активность содержит произведение множества основных мультипликативных членов, причем каждый из основных мультипликативных членов содержит (1) фиктивную переменную, представляющую присутствие/отсутствие определенной субъединицы конкретного типа в конкретном положении в последовательности, и (2) коэффициент, представляющий вклад определенной субъединицы в активность; и

(c) использование модели последовательность-активность, для того чтобы идентифицировать одну или более субъединиц конкретных типов в конкретных положениях для вариации для воздействия на желаемую активность биологических молекул.

31. Способ по п. 30, в котором последовательность представляет собой весь геном, целую хромосому, сегмент хромосомы, коллекцию последовательностей генов взаимодействующих генов, ген, белок или полисахарид или любую их комбинацию.

32. Способ по п. 30, в котором субъединица представляет собой хромосому, сегмент хромосомы, гаплотип, ген, кодон, мутацию, нуклеотид, аминокислоту, моносахарид, липид или любую их комбинацию.

33. Компьютерная система, содержащая:

один или более процессоров;

системную память; и

одну или более читаемых компьютером сред для хранения, несущих сохраненные на них выполнимые компьютером инструкции, которые, когда выполняются одним или более процессорами, вынуждают компьютерную систему осуществлять способ проведения направленной эволюции биологических молекул, причем данный способ включает:

модель последовательность-активность предсказывает

активность как функцию типа субъединиц и положения субъединиц в последовательности,