RU2018109529A

RU2018109529A - Многоуровневая архитектура распознавания паттернов в биологических данных

Info

Publication number: RU2018109529A
Application number: RU2018109529A
Authority: RU
Inventors: Костянтин ВОЛЯНСКИЙ; Невенка ДИМИТРОВА
Original assignee: Конинклейке Филипс Н.В.
Priority date: 2015-08-17
Filing date: 2016-08-12
Publication date: 2019-09-19
Also published as: WO2017029249A1; US11710540B2; CN107924430A; US20180225414A1; JP7041614B6; US10832799B2; JP2018530815A; US20210020269A1; RU2018109529A3; EP3338211A1; JP7041614B2

Claims

1. Система (100) для обнаружения паттернов в компонентах по меньшей мере одного биологического организма, реализуемая по меньшей мере одним аппаратным процессором и содержащая:

препроцессор (110) данных, выполненный с возможностью составления первого набора данных признаков из по меньшей мере одного из геномных или протеомных данных компонентов указанного по меньшей мере одного биологического организма; и

модуль (112) кластеризации, выполненный с возможностью

выбора множества подгрупп по меньшей мере одного из генов или белков,

идентификации кластеров указанных компонентов из частей первого набора данных признаков, соответствующего указанным выбранным подгруппам,

вычисления значений принадлежности для указанных компонентов, указывающих на принадлежность к указанным кластерам, и

выполнения процесса определения дополнительных кластеров для получения итоговых кластеров компонентов,

причем указанный процесс определения дополнительных кластеров осуществляют кластеризацию указанных компонентов на основании указанных значений принадлежности.

2. Система по п.1, в которой указанный модуль кластеризации также выполнен с возможностью повторения указанного процесса определения дополнительных кластеров для получения указанных итоговых кластеров,

причем каждое из повторений указанного процесса определения дополнительных кластеров включает определение других кластеров указанных компонентов из дополнительного набора данных признаков, состоящего по меньшей мере из части предшествующих значений принадлежности, определенных в результате предыдущего выполнения указанного процесса определения дополнительных кластеров.

3. Способ (200) обнаружения паттернов в компонентах по меньшей мере одного биологического организма, реализуемый по меньшей мере одним аппаратным процессором и включающий:

составление (202) первого набора данных признаков из по меньшей мере одного из геномных или протеомных данных компонентов указанного по меньшей мере одного биологического организма;

выбор (210) множества подгрупп по меньшей мере одного из генов или белков,

идентификацию (212) кластеров из частей первого набора данных признаков, соответствующего указанным выбранным подгруппам,

вычисление (214) значений принадлежности для указанных компонентов, указывающих на принадлежность к указанным кластерам; и

выполнение (208) процесса определения дополнительных кластеров для получения итоговых кластеров компонентов, причем в указанном процессе определения дополнительных кластеров осуществляют кластеризацию указанных компонентов на основании указанных значений принадлежности.

4. Способ по п. 3, в котором указанные значения принадлежности представляют собой первые значения принадлежности,

причем указанное выполнение (208) включает идентификацию (212) вторых кластеров указанных компонентов из второго набора данных признаков, состоящего по меньшей мере из части указанных первых значений принадлежности, и вычисление (214) вторых значений принадлежности для указанных компонентов, указывающих на принадлежность к указанным вторым кластерам.

5. Способ по п. 4, в котором указанное выполнение (208) включает выбор (210) различных подгрупп указанной по меньшей мере части указанных первых значений принадлежности и выполнение (212) подпроцесса определения кластеров для каждой из указанных различных подгрупп указанной по меньшей мере части указанных первых значений принадлежности для получения указанных вторых кластеров.

6. Способ по п. 4, в котором указанное определение (208) кластеров указанных компонентов включает формирование (216) указанного второго набора данных признаков путем определения степеней избыточности между кластерами указанных первых кластеров и отсечения (218) значений принадлежности по меньшей мере одного соответствующего кластера из указанных первых кластеров, соответствующая степень избыточности которого превышает пороговое значение.

7. Способ по п. 4, также включающий:

повторение указанного выполнения (208) для получения указанных итоговых кластеров, причем каждое из повторений указанного выполнения включает идентификацию (212) других кластеров указанных компонентов из дополнительного набора данных признаков, состоящего по меньшей мере из части предшествующих значений принадлежности, определенных в результате предыдущего указанного выполнения.

8. Способ по п.7, в котором по меньшей мере одно из указанных повторений указанного выполнения включает выбор (210) различных подгрупп указанной по меньшей мере части предшествующих значений принадлежности и выполнение (212) подпроцесса определения кластеров для каждой из указанных различных подгрупп указанной по меньшей мере части указанных предшествующих значений принадлежности.

9. Способ по п. 8, в котором по меньшей мере одно из указанных повторений указанного выполнения включает формирование (216) соответствующего набора данных признаков путем определения степеней избыточности между другими кластерами и отсечения (218) значений принадлежности по меньшей мере одного соответствующего кластера на указанных других кластеров, соответствующая степень избыточности которого превышает пороговое значение.

10. Способ по п. 3, в котором указанные значения принадлежности обозначают вероятность принадлежности к соответствующим кластерам.

11. Способ по п. 3, в котором по меньшей мере одно из указанных определения или выполнения включает отсечение (218) указанных различных подгрупп по меньшей мере одного из генов или белков на основании вычислений избыточности кластеров.

12. Способ по п. 3, также включающий:

отображение (226) представления по меньшей мере одной из указанных итоговых кластеров или подгрупп по меньшей мере одного из генов или белков, обозначающих указанные итоговые кластеры, причем указанное отображение включает отображение по меньшей мере одного из клинических или фенотипических аннотаций для указанных итоговых кластеров.

13. Способ по п. 12, в котором указанные аннотации содержат по меньшей мере одно из данных о реакции на лекарственное средство, вероятности рецидива заболевания или данных о подтипе заболевания.

14. Способ по п. 3, также включающий:

присвоение каждому из итоговых кластеров по меньшей мере одного из клинических переменных, клинических результатов, или клинических ярлыков;

причем по меньшей мере одной пробы биологических данных;

поиск по меньшей мере одного соответствия указанной по меньшей мере одной пробе биологических данных путем сравнения указанной пробы с представлениями указанных итоговых кластеров и

вывод по меньшей мере одного из клинических переменных, клинических результатов или клинических ярлыков, присвоенных представлению по меньшей мере одного из указанных итоговых кластеров, соответствующих указанной по меньшей мере одной пробе биологических данных, в качестве диагностической информации.

15. Компьютерочитаемый носитель (408), содержащий компьютерочитаемую программу, которая, при ее исполнении компьютером, обеспечивает возможность выполнения компьютером способа по п. 3.