RU2819348C1 - Способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фмрт - Google Patents

Способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фмрт Download PDF

Info

Publication number
RU2819348C1
RU2819348C1 RU2023115766A RU2023115766A RU2819348C1 RU 2819348 C1 RU2819348 C1 RU 2819348C1 RU 2023115766 A RU2023115766 A RU 2023115766A RU 2023115766 A RU2023115766 A RU 2023115766A RU 2819348 C1 RU2819348 C1 RU 2819348C1
Authority
RU
Russia
Prior art keywords
value
depressive disorder
major depressive
graph
matrices
Prior art date
Application number
RU2023115766A
Other languages
English (en)
Inventor
Александр Евгеньевич Храмов
Елена Николаевна ПИЦИК
Семен Андреевич Куркин
Анастасия Сергеевна Буторова
Александр Петрович Сергеев
Original Assignee
Федеральное государственное автономное образовательное учреждение высшего образования "Уральский федеральный университет имени первого Президента России Б.Н. Ельцина"
Filing date
Publication date
Application filed by Федеральное государственное автономное образовательное учреждение высшего образования "Уральский федеральный университет имени первого Президента России Б.Н. Ельцина" filed Critical Федеральное государственное автономное образовательное учреждение высшего образования "Уральский федеральный университет имени первого Президента России Б.Н. Ельцина"
Application granted granted Critical
Publication of RU2819348C1 publication Critical patent/RU2819348C1/ru

Links

Abstract

Изобретение относится к способу графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фМРТ. Технический результат заключается в повышении точности определения наличия большого депрессивного расстройства по данным фМРТ. В способе регистрируют сигнал функциональной МРТ головного мозга в состоянии покоя у испытуемых контрольной группы и испытуемых с диагностированным большим депрессивным расстройством, в результате чего строят, в соответствии с автоматическим атласом анатомической разметки AAL3, корреляционную матрицу размером 166*166, каждый элемент корреляционной матрицы хранит в себе коэффициент корреляции Пирсона, к элементам матрицы применяют 20 пороговых значений в диапазоне от 0,0 до 0,95 с шагом 0,05, при этом значения коэффициента корреляции ниже порогового значения зануляют и из исходной матрицы получают 20 наборов матриц разной степени разреженности, бинаризуют матрицы путем присвоения значения «1» для коэффициентов корреляции, отличных от нуля, полученные 20 наборов бинаризованных матриц интерпретируют как матрицы смежности графов, для каждого набора с характерным для него пороговым значением строят распределение относительных частот по значениям кратчайших путей графа для обеих групп испытуемых, для каждого распределения вычисляют значение d* – длину кратчайшего пути с максимальным значением t-статистики на основе t-критерия для независимых выборок с поправкой на задачу множественных сравнений, строят и обучают на 20 наборах бинаризованных матриц разной степени разреженности, полученных на предыдущих этапах способа, три графовых нейронных сети с одним выходом, который может находиться в состояниях «0» и «1», и с количеством сверточных графовых слоев, равным соответственно d*, d*-1 и d*+1, рассчитывают значение метрики F1 для каждой из трех построенных графовых нейронных сетей, и в качестве классификатора выбирают сеть с максимальным из трех значением F1, подают на вход классификатора матрицу смежности испытуемого, для которого необходимо сделать вывод о наличии или отсутствии большого депрессивного расстройства: при получении на выходе классификатора значения «0» делают вывод об отсутствии у испытуемого большого депрессивного расстройства, при получении на выходе классификатора значения «1» делают вывод о наличии у испытуемого большого депрессивного расстройства. 5 ил.

Description

Изобретение относится к области цифровой обработки и анализа данных и предназначено для классификации сигналов фМРТ головного мозга на отсутствие или наличие большого депрессивного расстройства (БДР). Технический результат может найти применение в программно-аппаратных комплексах для диагностики БДР, а также в комплексе программ для анализа сетевых данных нейрофизиологической и/или иной природы.
Ранняя диагностика большого депрессивного расстройства жизненно необходима для пациентов, страдающих тяжелыми и необратимыми последствиями депрессии. Анализ функциональной связности, основанный на данных фМРТ, может предоставить ценные биомаркеры для клинической диагностики БДР. Данные фМРТ представляют собой корреляционные матрицы, которые могут быть интерпретированы как матрицы смежности графов и классифицированы методами на основе искусственных нейронных сетей. Графовые нейронные сети (ГНС) были введены специально для решения задач, связанных с обработкой графовых данных. Внутренние свойства графовых данных накладывают большие ограничения на существующие методы машинного обучения и искусственного интеллекта. При анализе графовых данных необходимо учитывать структуру связей между узлами графа, свойства узлов и рёбер графа, существование зависимости между узлами и т.д.
Известна ансамблевая модель на основе ГНС для классификации БДР [1]. Модель достигла точности 73% на данных фМРТ 821 испытуемого с диагностированным БДР и 765 испытуемых контрольной группы. В подходе [1] авторам удалось решить проблему переобучения ГНС за счет использования перекрестной проверки, однако скорость обучения не была принята во внимание. Также авторам не удалось достичь эффективности классификации БДР по сравнению с другими подходами.
В решении [2] проблема постановки диагноза БДР была сформулирована как задача классификации графов. Набор данных фМРТ включал 1300 испытуемых с диагностированным БДР и 1128 испытуемых контрольной группы. Была построена графовая нейронная сеть, результат классификации которой превзошел такие нейросетевые подходы, как многослойный персептрон, машину опорных векторов, дерево решений, и составил 67,43% по метрике F1.
Недостатками указанных решений является невозможность их применения в случае недостаточного объёма исследуемой выборки, позволяющего корректно обучить искусственную нейронную сеть. Кроме того, указанные способы продемонстрировали недостаточно высокую точность классификации данных фМРТ, имеющих графовую структуру.
Предлагаемое техническое решение свободно от упомянутых недостатков: способ графовой нейросетевой классификации имеет более высокую точность по сравнению с известными решениями [1, 2] и может использоваться на относительно малых и несбалансированных выборках. Предлагаемое техническое решение отличается тем, что способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фМРТ включает анализ топологических свойств обрабатываемых данных фМРТ, что напрямую влияет на сходимость процесса обучения, вычислительные затраты и точность классификации. Предлагаемое техническое решение разработано для классификации данных фМРТ, интерпретируемых как графовые данные, которые недостаточно эффективно классифицируются с использованием других методов глубокого обучения.
Известно, что несмотря на высокую эффективность ГНС в обработке графовых данных, существует ограничение на количество слоёв в архитектуре ГНС, значительно снижающее качество классификации. Ограничение обусловлено тем, что операция свёртки в графовых сверточных сетях является частным случаем Лапласовского сглаживания, многократное применение которого приводит к схождению характеристик узлов графа к аналогичным значениям [3]. Предлагаемый способ основан на снижении количества связей в исходном наборе данных путём применения пороговых значений с целью снижения избыточности подаваемых данных и контроля переобучения, а также на использовании кратчайшего пути как параметра, определяющего оптимальное количество свёрточных слоев в ГНС для обрабатываемого набора данных.
Техническим результатом, обеспечиваемым приведенной совокупностью признаков, является подбор оптимизированной архитектуры графовой нейронной сети для классификации данных фМРТ, интерпретируемых как графовые данные. Архитектура ГНС с наиболее оптимальным результатом классификации графовых данных определяется топологическими свойствами обрабатываемых данных, выявляемых с помощью статистического анализа топологий графов. Также технический результат достигается тем, что исходный набор данных подвергается процедуре прореживания с помощью набора пороговых значений для весов узлов. Для полученных наборов данных после применения пороговых значений считаются распределения кратчайших путей, после чего полученные распределения анализируются с помощью статистического критерия для независимых выборок для получения наиболее значимого значения длины кратчайшего пути, имеющего наиболее высокое значение статистики.
Предлагаемый способ поясняется чертежами. На фиг. 1 представлена общая схема предлагаемого способа графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фМРТ. На фиг. 1А показан способ репрезентации графовых данных для обучения ГНС, где количество наборов данных равняется = 20 - числу применяемых пороговых значений. На фиг. 1B показана схема обучения ГНС для полученных наборов данных. На фиг. 2 показаны изменения в распределениях степеней исходного набора данных в зависимости от применяемого значения . На фиг. 3 показаны изменения в распределениях кратчайших путей в зависимости от применяемого значения . На фиг. 4 показаны: A - зависимость значения t-статистики от значения длины кратчайшего пути d и величины порога ; B - зависимость значения метрики F1 от количества слоёв в рассматриваемой ГНС (параметр number of layers) и величины порога ; С - корреляция между количеством слоёв в ГНС с наибольшим F1 для каждого порога и длины кратчайшего пути с наибольшей t-статистикой (p < 0,05). На фиг. 5 показаны кривые ROC для трех = [0,45, 0,70, 0,95] для двух случаев: модель ГНС с 1 блоком GCN (черная кривая) и модель ГНС с лучшей производительностью (красная кривая), архитектура которой подобрана в соответствии с предлагаемым способом.
Предлагаемый способ осуществляется следующим образом.
На первом этапе регистрируют сигнал функциональной МРТ головного мозга в состоянии покоя у испытуемых контрольной группы и испытуемых с диагностированным большим депрессивным расстройством. На фиг. 1 представлено схематическое изображение предлагаемого способа на примере классификации корреляционных матриц фМРТ двух групп испытуемых. Исходные данные представляют собой 84 корреляционные матрицы фМРТ: 49 матриц испытуемых контрольной группы (Control), 35 матриц испытуемых с большим депрессивным расстройством (MDD). Корреляционные матрицы фМРТ строятся в соответствии с автоматическим атласом анатомической разметки AAL3 и имеют размер 166*166. Каждый элемент корреляционной матрицы хранит в себе коэффициент корреляции Пирсона (фиг. 1(а)). Здесь x - набор характеристик узла. Поскольку каждый узел в корреляционной матрице представляет одну область мозга, этот набор был представлен в виде матрицы 166х166, где первое измерение соответствует каждому узлу, а второе - признакам. Такая формулировка обозначает, что каждый узел уникален и имеет отдельный признак, без указания характера признака. Поле индексы ребер представляет собой двумерный массив, содержащий ребра корреляционной матрицы в координатном формате. Значения в первой и второй строке являются индексами исходящих и входящих узлов, соответственно. Наконец, одноэлементный массив цель содержит метку текущего графа, которая в задаче бинарной классификации была либо 0, либо 1. В данном примере, метка 0 была присвоена классу MDD, а метка 1 - классу Control.
На втором этапе каждая корреляционная матрица фМРТ проходит через процедуру прореживания, заключающуюся в том, что к значениям коэффициента Пирсона в корреляционных матрицах применяется пороговое значение, при этом все значения в матрице ниже порогового приравниваются к нулю. Применение пороговых значений позволяет отбросить наименее значимые связи и снизить избыточность в данных, на которых обучается ГНС, что позволяет контролировать переобучение. В данном решении предлагается применение 20 пороговых значений от 0,0 до 0,95 с шагом 0,05. В результате из исходной корреляционной матрицы получается 20 наборов матриц (смежности) разной степени разреженности.
После применения порога производится анализ топологических свойств бинаризованных корреляционных матриц. Для каждого полученного набора матриц с характерным для него пороговым значением строят распределение относительных частот по значениям кратчайших путей графа для обеих групп испытуемых. Увеличение порогового значения приводит к изменению топологических характеристик анализируемых данных, переходя от распределения степеней, близкого к случайному, к безмасштабному распределению при максимальном пороге, как показано на фиг. 2. При этом вид распределения кратчайших путей меняется с увеличением порогового значения, и эти изменения различны в двух группах, как показано на фиг. 3. Для каждого распределения вычисляется значение d* - длина кратчайшего пути с максимальным значением t-статистики на основе t-критерия для независимых выборок с поправкой на задачу множественных сравнений. На фиг. 4(б) показана зависимость полученного значения t-статистики от применяемого порога . Видно, что при увеличении порогового значения, количество кратчайших путей длины d значительно увеличивается в одной группе, но не в другой, при этом белая область, выделяющая значения t-статистики с соответствующим p < 0,05, соответствует более длинным кратчайшим путям с увеличением .
На третьем этапе осуществляется построение графового нейросетевого классификатора. Каждый набор данных, полученный с помощью применения пороговых значений , используется для обучения трех моделей ГНС с количеством сверточных графовых слоев, равным d*, d*+1 и d*-1 для данной выборки с учетом возможной погрешности.
В данном изобретении используется ГНС со следующим набором гиперпараметров:
1) Скорость обучения (learning rate) - 0,0005;
2) Количество скрытых нейронов на всех слоях - 166;
3) Функция оптимизации - Adam;
4) Функция ошибки - бинарная кросс-энтропия;
5) Размер пакета - 32;
6) Исключение (dropout) - 20%;
7) Количество эпох обучения - 100.
Обязательными составляющими архитектуры ГНС являются один сверточный блок (GCN) и один выходной блок, содержание которых показано на фиг. 1(б). Сверточный блок состоит из оператора GraphConv:
,
где - вес ребра между узлами i и j [4].
GCN блок также содержит функцию активации ReLU (rectified linear unit, линейный выпрямитель):
,
и оператор пакетной нормализации (batch normalization).
Выходной блок (output block) содержит слой субдискретизации (global max pool) с функцией максимума для снижения размерности данных, полученных на предыдущем этапе в ходе обработки в блоке GCN, сигмоиду в качестве функции активации, оператор пакетной нормализации, оператор исключения с параметром 20% (dropout) и полносвязный линейный слой с 166 входными и одним выходным нейроном, который может находиться в состояниях «0» и «1», для финальной классификации двух целевых классов.
В процессе осуществления способа используется техника кросс-валидации на основе стратифицированного k-fold с количеством комбинаций, равным 10. Для оценки работы нейросетевого классификатора рассчитывается параметр F1-score, на основе которого принимается решение о качестве работы нейросетевого классификатора:
,
где TP (true positive) - количество истинно-положительных решений (БДР есть, и оно обнаружено классификатором), FP (false positive) - количество ложноположительных решений (БДР отсутствует, но оно обнаружено) и FN (false negative) - количество ложноотрицательных решений (БДР есть, но оно не обнаружено). Метрика F1 имеет диапазон значений от 0 до 1, чем выше значение F1, тем выше качество классификации нейронной сети.
В результате в качестве графового нейросетевого классификатора выбирается модель с максимальным из трех построенных графовых нейронных сетей значением метрики F1. Данное решение основывается на том, что, как показано на фиг. 4(в), при увеличении порогового значения увеличивается также количество блоков GCN с максимальной оценкой F1 для данного набора данных. Помимо этого, на фиг. 4(г) показана стойкая корреляция между d* и параметром , равным количеству блоков GCN, показавшим наибольшую оценку F1 для данного набора данных (на фиг. 4(в) эти значения выделены белой рамкой). Видно, что между топологическими характеристиками исходного набора данных и «глубиной» архитектуры ГНС существует положительная корреляция с коэффициентом корреляции Спирмена 0,72 и соответствующим значением p < 0,05.
На фиг. 5 представлены ROC-кривые обучения, построенные на основе процесса обучения ГНС на корреляционных матрицах фМРТ для ГНС с одним блоком GCN (черная кривая) и ГНС с оптимальным количеством блоков GCN, выбранного на основе предлагаемого способа (красная кривая). Видно, что архитектура ГНС, подобранная индивидуально под каждый набор данных на основе топологических характеристик, показывает более стабильные результаты работы в сравнении со стандартной моделью с одним сверточным слоем.
На вход классификатора подают матрицу смежности испытуемого, для которого необходимо сделать вывод о наличии или отсутствии большого депрессивного расстройства: при получении на выходе классификатора значения «0» делают вывод об отсутствии у испытуемого большого депрессивного расстройства, при получении на выходе классификатора значения «1» делают вывод о наличии у испытуемого большого депрессивного расстройства.
Список источников
1. Venkatapathy S., Votinov M., Wagels L., Kim S., Lee M., Habel U., Ra I.H., Jo H.G. Ensemble graph neural network model for classification of major depressive disorder using whole-brain functional connectivity // Frontiers in Psychiatry. - 2023. - Vol. 14. 1125339.
2. Zhao, T., Zhang, G. Detecting Major Depressive Disorder by Graph Neural Network Exploiting Resting-State Functional MRI // In: Tanveer, M., Agarwal, S., Ozawa, S., Ekbal, A., Jatowt, A. (eds) Neural Information Processing. ICONIP 2022. Communications in Computer and Information Science. - 2023. - Springer, Singapore. - Vol. 1792.
3. Li Q., Han Z., Wu X.M. Deeper insights into graph convolutional networks for semi-supervised learning // Proceedings of the AAAI conference on artificial intelligence. - 2018. - Vol. 32. - №. 1.
4. Morris C. et al. Weisfeiler and leman go neural: Higher-order graph neural networks // Proceedings of the AAAI conference on artificial intelligence. - 2019. - Vol. 33. - №. 01. - P. 4602-4609.

Claims (1)

  1. Способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фМРТ, при котором регистрируют сигнал функциональной МРТ головного мозга в состоянии покоя у испытуемых контрольной группы и испытуемых с диагностированным большим депрессивным расстройством, в результате чего строят, в соответствии с автоматическим атласом анатомической разметки AAL3, корреляционную матрицу размером 166*166, каждый элемент корреляционной матрицы хранит в себе коэффициент корреляции Пирсона, к элементам матрицы применяют 20 пороговых значений в диапазоне от 0,0 до 0,95 с шагом 0,05, при этом значения коэффициента корреляции ниже порогового значения зануляют и из исходной матрицы получают 20 наборов матриц разной степени разреженности, бинаризуют матрицы путем присвоения значения «1» для коэффициентов корреляции, отличных от нуля, полученные 20 наборов бинаризованных матриц интерпретируют как матрицы смежности графов, для каждого набора с характерным для него пороговым значением строят распределение относительных частот по значениям кратчайших путей графа для обеих групп испытуемых, для каждого распределения вычисляют значение d* – длину кратчайшего пути с максимальным значением t-статистики на основе t-критерия для независимых выборок с поправкой на задачу множественных сравнений, строят и обучают на 20 наборах бинаризованных матриц разной степени разреженности, полученных на предыдущих этапах способа, три графовых нейронных сети с одним выходом, который может находиться в состояниях «0» и «1», и с количеством сверточных графовых слоев, равным соответственно d*, d*-1 и d*+1, рассчитывают значение метрики F1 для каждой из трех построенных графовых нейронных сетей, и в качестве классификатора выбирают сеть с максимальным из трех значением F1, подают на вход классификатора матрицу смежности испытуемого, для которого необходимо сделать вывод о наличии или отсутствии большого депрессивного расстройства: при получении на выходе классификатора значения «0» делают вывод об отсутствии у испытуемого большого депрессивного расстройства, при получении на выходе классификатора значения «1» делают вывод о наличии у испытуемого большого депрессивного расстройства.
RU2023115766A 2023-06-16 Способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фмрт RU2819348C1 (ru)

Publications (1)

Publication Number Publication Date
RU2819348C1 true RU2819348C1 (ru) 2024-05-17

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110269633A1 (en) * 2008-03-12 2011-11-03 John Bilello Inflammatory biomarkers for monitoring depressive disorders
CN110522448A (zh) * 2019-07-12 2019-12-03 东南大学 一种基于图卷积神经网络的脑网络分类方法
CN111127441A (zh) * 2019-12-25 2020-05-08 兰州大学 一种基于图节点嵌入的多模态脑影像抑郁识别方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110269633A1 (en) * 2008-03-12 2011-11-03 John Bilello Inflammatory biomarkers for monitoring depressive disorders
CN110522448A (zh) * 2019-07-12 2019-12-03 东南大学 一种基于图卷积神经网络的脑网络分类方法
CN111127441A (zh) * 2019-12-25 2020-05-08 兰州大学 一种基于图节点嵌入的多模态脑影像抑郁识别方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Manyun Zhu и др. "The classification of brain network for major depressive disorder patients based on deep graph convolutional neural network", опубл. 26.01.2023, URL: https://www.frontiersin.org/articles/10.3389/fnhum.2023.1094592/full. Elena Bondi и др. "A systematic review on the potential use of machine learning to classify major depressive disorder from healthy controls using resting state fMRI measures", опубл. 24.11.2022, URL: https://www.sciencedirect.com/science/article/pii/S0149763422004614. *

Similar Documents

Publication Publication Date Title
Lipton et al. Detecting and correcting for label shift with black box predictors
Liu et al. Discrete-valued neural communication
Perrone et al. Poisson random fields for dynamic feature models
CN112699960A (zh) 基于深度学习的半监督分类方法、设备及存储介质
Perrone et al. Poisson random fields for dynamic feature models
CN114595725B (zh) 一种基于加法网络和监督对比学习的脑电信号分类方法
Naranjo-Alcazar et al. On the performance of residual block design alternatives in convolutional neural networks for end-to-end audio classification
Leeb et al. Exploring the latent space of autoencoders with interventional assays
Bakır et al. Detection of pneumonia from x-ray images using deep learning techniques
Sun et al. Class-driven graph attention network for multi-label time series classification in mobile health digital twins
US11397868B2 (en) Fungal identification by pattern recognition
Memiş et al. A classification method based on Hamming pseudo-similarity of intuitionistic fuzzy parameterized intuitionistic fuzzy soft matrices
Remzan et al. Ensemble transfer learning for brain tumor classification
Rosales-Pérez et al. Infant cry classification using genetic selection of a fuzzy model
RU2819348C1 (ru) Способ графовой нейросетевой классификации на отсутствие или наличие большого депрессивного расстройства по данным фмрт
Blöbaum et al. Estimation of interventional effects of features on prediction
CN111916204A (zh) 一种基于自适应稀疏深度神经网络的脑疾病数据评估方法
Svetlov et al. A new implementation of the algorithm of adaptive construction of hierarchical neural network classifiers
CN115829054A (zh) 基于机器学习模型对脑网络异常边连接的预测方法
CN114224354A (zh) 心律失常分类方法、装置及可读存储介质
Sharma et al. Prediction of Parkinson's Disease Using Machine Learning Techniques
Perez et al. Face Patches Designed through Neuroevolution for Face Recognition with Large Pose Variation
Mohanty et al. ASD classification in adolescent and adult utilizing deep neural network
Paylakhi et al. A novel gene selection method using GA/SVM and fisher criteria in Alzheimer's disease
Parkavi et al. Decision support system using CNN for detecting the type of disease in fruits and vegetables