RU2191429C1 - Способ автоматизированной диагностики заболеваний и их форм - Google Patents
Способ автоматизированной диагностики заболеваний и их форм Download PDFInfo
- Publication number
- RU2191429C1 RU2191429C1 RU2001108941A RU2001108941A RU2191429C1 RU 2191429 C1 RU2191429 C1 RU 2191429C1 RU 2001108941 A RU2001108941 A RU 2001108941A RU 2001108941 A RU2001108941 A RU 2001108941A RU 2191429 C1 RU2191429 C1 RU 2191429C1
- Authority
- RU
- Russia
- Prior art keywords
- disease
- signs
- forms
- heuristic
- probability
- Prior art date
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Изобретение относится к области медицинской диагностики и может быть использовано для диагностики любого заболевания по совокупности диагностических признаков состояния организма. Способ включает конструирование системы эвристических признаков, описывающих различные заболевания, их классификацию по каждому диагностируемому заболеванию и дифференциальную диагностику его формы с использованием кластерного анализа в выбранном пространстве эвристических признаков. Конструирование системы эвристических признаков осуществляют путем формирования информативных признаков состояния организма для каждого заболевания с определением оптимального интервала дискретизации каждого количественного признака и числа его градаций с последующей их дифференциацией по формам заболевания, а классификацию по каждому диагностируемому заболеванию осуществляют с помощью интегрального сравнения сигнала болезни с порогом нормы и производят оценку вероятности надежного распознавания заболевания P*, используя соотношение
где G0 - отношение информационных емкостей признаков болезнь/норма; Ф - интеграл вероятности; N - число признаков; Gi, ni - текущие значения соответственно аппаратурного отношения сигнал/шум и качественного признака болезни. Это позволяет повысить вероятность правильной диагностики заболеваний и их форм в условиях статистической недостаточности и неоптимальности существующих баз медицинских данных. 3 ил., 1 табл.
где G0 - отношение информационных емкостей признаков болезнь/норма; Ф - интеграл вероятности; N - число признаков; Gi, ni - текущие значения соответственно аппаратурного отношения сигнал/шум и качественного признака болезни. Это позволяет повысить вероятность правильной диагностики заболеваний и их форм в условиях статистической недостаточности и неоптимальности существующих баз медицинских данных. 3 ил., 1 табл.
Description
Изобретение относится к области медицинской диагностики и может быть использовано для диагностики любого заболевания по совокупности диагностических признаков состояния организма.
Известен интегральный пороговый способ диагностики заболеваний, который используется для определения физиологического состояния при моделировании невроза у лабораторных животных. В нем определяют показатели функционального состояния организма в баллах для заданных градаций патологии каждого показателя, определяют глубину невротического состояния, сравнивая интегральные показатели, установленные для различных степеней патологии, с интегральной оценкой уровня патологии в баллах, для экспериментального животного [А.С. 1824186 СССР, МКИ 2 А 61 В 5/00. Способ определения физиологического состояния при моделировании невроза у лабораторных животных/В.В.Лавров. - Заявлено 27.12.90; опубл. 30.06.93, Бюл. 24].
Недостатком этого способа является большое число случаев гипердиагностики (случаев, когда вместо состояния нормы определяется патология или ставится более тяжелая форма патологии, чем та, что определил врач-эксперт), возникающих в результате выбора порога нормы таким образом, чтобы число случаев пропуска заболевания было минимальным, и отсутствие оценки вероятности правильной классификации состояния животного.
Наиболее близким по технической сущности и достигаемому эффекту является способ дифференциальной диагностики заболеваний на базе кластерного анализа. Этот способ применяется для диагностики степени тяжести инфаркта миокарда [Кузнецов С.И. Инвариантное моделирование в медицине на базе кластерного анализа. - Воронеж: Изд-во ВГУ, 1997, - 208 с.]. Для этой цели осуществляется подбор рационального минимума показателей, максимально характеризующих текущее состояние пациента и имеющих прогностически весомое значение, проводится нормирование признаков заболевания, строится матрица взаимных евклидовых расстояний между объектами. Решающее правило имеет вид: два рассматриваемых объекта принадлежат одному кластеру, если расстояние между ними меньше половины среднего расстояния между объектами указанной матрицы.
Недостатком этого способа является то, что надежная диагностика возможна только в случае равномерности обучающих выборок по формам заболевания, то есть число случаев заболевания, содержащееся в базе медицинских данных по каждой форме заболевания, должно быть примерно одинаково. Собрать такую базу медицинских данных довольно сложно, так как одни формы заболевания встречаются нечасто, в то время как другие - в подавляющем большинстве случаев. Такое несоответствие по числу историй болезней разных форм заболевания в обучающей выборке приводит к тому, что кластеры этих форм в пространстве признаков имеют существенно разный размер. В этом случае возможна надежная диагностика лишь тех форм заболевания, кластеры которых примерно одинаковы по размеру. Поэтому, по сведениям самих авторов, надежная классификация заболевания достигалась лишь в случае исключения из базы данных случаев атипичного протекания заболевания.
Техническая задача изобретения - повышение вероятности правильной диагностики заболеваний и их форм в условиях статистической недостаточности и неоптимальности существующих баз медицинских данных.
Техническая задача достигается тем, что в способе автоматизированной диагностики заболеваний и их форм, включающем конструирование системы эвристических признаков, описывающих различные заболевания, их классификацию по каждому диагностируемому заболеванию и дифференциальную диагностику его формы с использованием кластерного анализа в выбранном пространстве эвристических признаков новым является то, что конструирование системы эвристических признаков осуществлено путем формирования информативных признаков состояния организма для каждого заболевания с определением оптимального интервала дискретизации каждого количественного признака и числа его градаций с последующей их дифференциацией по формам заболевания, а классификация по каждому диагностируемому заболеванию осуществлена с помощью интегрального сравнения сигнала болезни с порогом нормы и произведена оценка вероятности надежного распознавания заболевания Р*, используя соотношение
где G0 - отношение информационных емкостей признаков болезнь/норма,
Ф - интеграл вероятности,
N - число признаков;
Gi, ni - текущие значения соответственно аппаратурного отношения сигнал/шум и качественного признака болезни.
где G0 - отношение информационных емкостей признаков болезнь/норма,
Ф - интеграл вероятности,
N - число признаков;
Gi, ni - текущие значения соответственно аппаратурного отношения сигнал/шум и качественного признака болезни.
Технический результат изобретения заключается в том, что становится возможной оптимальная организация системы признаков заболевания и их градаций и иерархическое построение интегральных и дифференциальных решающих правил, в результате чего повышается вероятность правильной диагностики заболевания, в том числе и атипичных его случаев в условиях неоптимальности и статистической недостаточности имеющихся баз медицинских данных.
Способ предложенной автоматизированной диагностики заболеваний и их форм осуществляется в несколько этапов. Первым этапом является конструирование системы эвристических признаков, организованной как информационное сообщение организма о его состоянии.
Оптимальной, с точки зрения наглядности, возможности включения новых признаков в диагностическую систему, строгости и простоты классификации является информационная организация системы признаков, где по оси абсцисс откладывается номер признака, а по оси ординат его информационная емкость в битах (фиг. 1). Используемые признаки могут быть как качественными, так и количественными, причем последовательность расположения признаков в диагностической системе не имеет значения, то есть система инвариантна по номеру признака. Качественные признаки имеют две возможные градации: отсутствие признака - норма, и наличие признака - болезнь. Начальным уровнем отсчета количественных признаков является его среднее нормальное значение.
Информационную емкость сообщения системы признаков оценим по Хартли С= Nlog2n, причем сообщение (1) назовем сигналом нормы Сн
где n - число градаций признака, N - число признаков системы. Например, в случае болезни для качественного признака n=2 получаем 1 бит информации. Информационная емкость количественного признака зависит от выбранного для него оптимального числа градаций n.
где n - число градаций признака, N - число признаков системы. Например, в случае болезни для качественного признака n=2 получаем 1 бит информации. Информационная емкость количественного признака зависит от выбранного для него оптимального числа градаций n.
На втором этапе определяется оптимальный интервал дискретизации каждого количественного признака и число его градаций с целью их дифференциации по формам заболевания.
Любой количественный признак, например температура тела, имеет среднюю вариацию нормы, которую обозначим как
ΔTнор = T -T . (2)
Если измеряемая температура тела Т выше или ниже границы нормы, то число градаций температурного признака в случае болезни
Точность современного диагностического оборудования такова, что число nб может быть довольно большим и существенно зависеть от ряда случайных факторов. Поэтому необходимо оптимизировать число градаций каждого количественного признака путем усреднения по интервалу дискретизации таким образом, чтобы в статистическом распределении каждого признака имелось столько ярко выраженных максимумов, сколько форм заболевания необходимо диагностировать.
ΔTнор = T
Если измеряемая температура тела Т выше или ниже границы нормы, то число градаций температурного признака в случае болезни
Точность современного диагностического оборудования такова, что число nб может быть довольно большим и существенно зависеть от ряда случайных факторов. Поэтому необходимо оптимизировать число градаций каждого количественного признака путем усреднения по интервалу дискретизации таким образом, чтобы в статистическом распределении каждого признака имелось столько ярко выраженных максимумов, сколько форм заболевания необходимо диагностировать.
На третьем этапе по каждому диагностируемому заболеванию осуществляется интегральное сравнение сигнала болезни с порогом нормы и производится оценка вероятности правильного распознавания заболевания.
Для оценки вероятности обнаружения количественного признака Роб болезни воспользуемся известным выражением [Тихонов В.И. Оптимальный прием сигналов. М.: Радио и связь, 1983].
где Ф - интеграл вероятности, G - аппаратурное отношение сигнал/шум, P2/P1 - отношение априорных вероятностей отсутствия и присутствия сигнала. При автоматизированной диагностике (Р2= Р1) надежное обнаружение признака возможно в случае G≥3. Вероятность ошибок первого и второго рода (пропуска болезни и гипердиагностики соответственно) минимизируется также при G≥3.
Так как вероятность обнаружения каждого количественного признака болезни может быть различной, то информационную емкость системы N независимых признаков, характеризующей заболевание, можно записать следующим образом
Далее реализуется интегральная классификация заболеваний путем сравнения информационной емкости сигнала болезни с порогом нормы, а также оценка вероятности правильного распознавания заболевания. Введем отношение
которое назовем отношением болезнь/норма. Оно подобно отношению сигнал/шум в статистической теории оптимального обнаружения сигналов [Тихонов В.И. Оптимальный прием сигналов. М.: Радио и связь, 1983].
Далее реализуется интегральная классификация заболеваний путем сравнения информационной емкости сигнала болезни с порогом нормы, а также оценка вероятности правильного распознавания заболевания. Введем отношение
которое назовем отношением болезнь/норма. Оно подобно отношению сигнал/шум в статистической теории оптимального обнаружения сигналов [Тихонов В.И. Оптимальный прием сигналов. М.: Радио и связь, 1983].
Решение о наличии болезни принимается при превышении сигнала болезни порогового уровня нормы. В этом случае вероятность распознавания болезни можно записать следующим образом:
В случае, когда вероятность обнаружения и число градаций каждого признака постоянны, вероятность распознавания болезни не зависит от числа признаков для N>2, так как с повышением информационной емкости системы признаков пропорционально увеличивается энтропия решающей системы. Это связано с тем фактором, что процесс обучения и распознавания реализуется по одной и той же выборке, определяемой базой медицинских данных. Кроме того, ясно, что использование только качественных признаков (n=2) неэффективно, так как вероятность распознавания болезни Р≤0,5. Для надежного распознавания болезни необходимо использование количественных признаков, получаемых аппаратурными методами, причем достаточно фиксировать от четырех до девяти градаций каждого признака.
В случае, когда вероятность обнаружения и число градаций каждого признака постоянны, вероятность распознавания болезни не зависит от числа признаков для N>2, так как с повышением информационной емкости системы признаков пропорционально увеличивается энтропия решающей системы. Это связано с тем фактором, что процесс обучения и распознавания реализуется по одной и той же выборке, определяемой базой медицинских данных. Кроме того, ясно, что использование только качественных признаков (n=2) неэффективно, так как вероятность распознавания болезни Р≤0,5. Для надежного распознавания болезни необходимо использование количественных признаков, получаемых аппаратурными методами, причем достаточно фиксировать от четырех до девяти градаций каждого признака.
Отметим, что полученные результаты могут модифицироваться с учетом изменения медицинской базы знаний, квалификации и опыта врача. Это связано с выбором оптимального числа градаций каждого признака, их весовых коэффициентов, определяющих диагностическую значимость каждого признака, учета корреляционных связей между признаками болезни. Очень важна оптимизация порога обнаружения каждого признака, так как вероятности его наличия и отсутствия могут быть далеко не одинаковыми.
На четвертом этапе в пределах каждого заболевания осуществляется дифференциальная диагностика его формы с использованием кластерного анализа в выбранном пространстве медицинских признаков.
Дисперсию каждой формы заболевания Dф (легкой, средней и тяжелой) вычислим по формуле:
где ф - наименование формы заболевания - легкая, средняя или тяжелая; М - число пациентов в базе данных с заболеванием со степенью тяжести ф, значение признака заболевания для рассматриваемого i-го пациента и среднее значение этого признака по всей имеющейся обучающей базе данных для отдельной формы заболевания.
где ф - наименование формы заболевания - легкая, средняя или тяжелая; М - число пациентов в базе данных с заболеванием со степенью тяжести ф, значение признака заболевания для рассматриваемого i-го пациента и среднее значение этого признака по всей имеющейся обучающей базе данных для отдельной формы заболевания.
Центром кластеров, соответствующих формам заболевания, являются средние значения признаков по каждой форме. Формой кластеров в простейшем случае может быть окружность в двумерном признаковом пространстве, сфера - в трехмерном и гиперсфера - в N-мерном пространстве признаков. Радиус гиперсферы есть среднее геометрическое значение дисперсий каждого признака, образующих признаковое пространство.
Для дифференциальной диагностики заболеваний решающее правило имеет следующий вид: рассматриваемая точка принадлежит кластеру той формы заболевания, для которой проекция расстояния от центра кластера до точки на прямую, соединяющую центры двух соседних кластеров, не превышает половины межцентрового расстояния соседних кластеров:
где rcф1-ф2 - межцентровое расстояние кластеров форм заболевания ф1 и ф2; m - рассматриваемая точка.
где rcф1-ф2 - межцентровое расстояние кластеров форм заболевания ф1 и ф2; m - рассматриваемая точка.
Способ поясняется на примере диагностики послеродового эндометрита, часто протекающего атипично и являющегося одним из самых трудно диагностируемых заболеваний, особенно в его легкой и средней формах [Кулаков В.И., Серов В. Н. , Гуртовой Б.Л., Емельянова А.И., Касабулатов Н.М. Послеродовой эндометрит. Информационное письмо. - М.: АВО, 1999, - 22 с.]. Диагностировался послеродовой эндометрит и его формы, отражающие степень тяжести заболевания: легкую, среднюю и тяжелую. Собранная база данных включала 70 историй болезней.
Была составлена оптимальная система из 17 наиболее информативных признаков, полученных по результатам клинического обследования, УЗИ матки, гистероскопии, бактериологического и бактериоскопического анализов. Формирование оптимальной системы признаков представляет собой итерационный процесс, в котором оптимизация осуществляется путем включения в диагностическую систему признаков, повышающих вероятность распознавания заболевания. Диаграмма нормированных средних значений признаков указанной системы приведена на фиг.1. Нормирование значений проводилось с учетом интервала их усреднения.
На втором этапе определялся оптимальный интервал дискретизации каждого признака системы и число их градаций путем усреднения по различным интервалам статистического распределения признака с выделением трех экстремумов, соответствующих легкой, средней и тяжелой формам заболевания. На фиг.2. показан график распределения плотности вероятности одного из признаков диагностической системы - температуры с интервалом усреднения 0,5oС, позволяющим четко выделить три формы заболевания, соответствующие трем экстремумам. Увеличение интервала усреднения приводит к объединению соседних форм заболевания, уменьшение - к росту числа случайных экстремумов. Аналогичные результаты получены и для других признаков диагностической системы.
На третьем этапе осуществлялось интегральное сравнение сигнала болезни с порогом нормы и производилась оценка вероятности распознавания заболевания с использованием соотношений (6) и (7).
С помощью интегрального порогового метода удалось диагностировать эндометрит в 100% случаев и абсолютно достоверно диагностировать все тяжелые формы заболевания. При диагностике этим методом легкой и средней форм эндометрита эффективность диагностики резко снижалась. Эксперимент показал, что число случаев компьютерной гипердиагностики составило 8,6% (была поставлена более тяжелая степень заболевания, чем во врачебном диагнозе), а случаев пропуска заболевания не было. Вероятность распознавания заболевания достигала 0,848, 0,858 и 0,965 для легкой, средней и тяжелой форм соответственно.
На четвертом этапе осуществлялась дифференциальная диагностика форм эндометрита с использованием кластерного анализа в выбранном пространстве признаков.
Обучающая выборка по тяжелой форме составляла 81,4%, по средней - 8,6%, а по легкой 10%. Такая неоптимальность обучающей выборки привела к тому, что дисперсии кластеров легкой и средней форм оказались существенно большими, чем для тяжелой. Для температуры эти кластеры приведены на фиг.3.
С помощью дифференциального кластерного метода удалось достаточно надежно диагностировать легкую и среднюю форму заболевания, которые хотя и образуют широкие, частично перекрывающиеся кластеры, но их размеры примерно одинаковы. Для историй болезни, вероятность распознавания заболевания которых на третьем этапе была не менее 0,895, диагностировалась тяжелая форма эндометрита и последний этап не выполнялся. Наблюдалось 7,7% несоответствий и 2,9% случаев компьютерной гипердиагностики. Результаты автоматизированной диагностики эндометрита и его форм приведены в таблице.
Таким образом, предлагаемый способ позволяет надежно распознавать заболевания и диагностировать достаточно близкие формы заболевания в условиях статистической недостаточности неоптимальности имеющихся баз медицинских данных, которую во многих случаях невозможно улучшить вследствие особенностей протекания болезней. Следует отметить, что способ может реализовываться в реальном масштабе времени, когда диагностируемые сигналы с медицинских датчиков заносятся в базу данных и обрабатываются в соответствии с предложенной последовательностью действий. Он позволяет оценить вероятность правильного распознавания заболевания и его форм, а также диагностировать атипичные случаи болезни по сравнению с известными прототипами. В результате повышается вероятность правильной классификации не только самого заболевания, но его атипичных форм.
Claims (1)
- Способ автоматизированной диагностики заболеваний и их форм, включающий конструирование системы эвристических признаков, описывающих различные заболевания, их классификацию по каждому диагностируемому заболеванию и дифференциальную диагностику его формы с использованием кластерного анализа в выбранном пространстве эвристических признаков, отличающийся тем, что конструирование системы эвристических признаков осуществляют путем формирования информативных признаков состояния организма для каждого заболевания с определением оптимального интервала дискретизации каждого количественного признака и числа его градаций с последующей их дифференциацией по формам заболевания, а классификацию по каждому диагностируемому заболеванию осуществляют с помощью интегрального сравнения сигнала болезни с порогом нормы и производят оценку вероятности надежного распознавания заболевания P*, используя соотношение
где G0 - отношение информационных емкостей признаков болезнь/норма;
Ф - интеграл вероятности;
N - число признаков;
Gi, ni - текущие значения соответственно аппаратурного отношения сигнал/шум и качественного признака болезни.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2001108941A RU2191429C1 (ru) | 2001-04-04 | 2001-04-04 | Способ автоматизированной диагностики заболеваний и их форм |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2001108941A RU2191429C1 (ru) | 2001-04-04 | 2001-04-04 | Способ автоматизированной диагностики заболеваний и их форм |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2191429C1 true RU2191429C1 (ru) | 2002-10-20 |
Family
ID=20247995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2001108941A RU2191429C1 (ru) | 2001-04-04 | 2001-04-04 | Способ автоматизированной диагностики заболеваний и их форм |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2191429C1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2540831C2 (ru) * | 2013-01-23 | 2015-02-10 | Олег Владимирович Чикало | Способ автоматизированной диагностики заболеваний |
RU2573218C2 (ru) * | 2009-09-04 | 2016-01-20 | Конинклейке Филипс Электроникс Н.В. | Поддержка принятия клинических решений |
-
2001
- 2001-04-04 RU RU2001108941A patent/RU2191429C1/ru active
Non-Patent Citations (1)
Title |
---|
КУЗНЕЦОВ С.И. Инвариантное моделирование в медицине на базе кластерного анализа. - Воронеж, изд-во ВГУ, 1997, с.208. КУЛАКОВ В.И. и др. Послеродовой эндометрит. Информационное письмо. - М.: АВО, 1999, 22 с. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2573218C2 (ru) * | 2009-09-04 | 2016-01-20 | Конинклейке Филипс Электроникс Н.В. | Поддержка принятия клинических решений |
RU2540831C2 (ru) * | 2013-01-23 | 2015-02-10 | Олег Владимирович Чикало | Способ автоматизированной диагностики заболеваний |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106934235A (zh) | 一种基于迁移学习的疾病领域间病人相似性度量迁移系统 | |
CN109801687B (zh) | 一种面向健康领域的因果关系知识库的构建方法和系统 | |
Schubert et al. | The ROC manifold for classification systems | |
CN107610009B (zh) | 一种基于神经网络的三位一体招生录取概率预测方法 | |
CN111863244A (zh) | 基于稀疏池化图卷积的功能连接精神疾病分类方法和系统 | |
CN112256754A (zh) | 基于标准模型的超声检测分析系统及方法 | |
CN116030958A (zh) | 辅助诊断方法、装置、设备及系统、存储介质 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
Kwon et al. | RMExplorer: A visual analytics approach to explore the performance and the fairness of disease risk models on population subgroups | |
CN118151119A (zh) | 一种面向检索任务的毫米波雷达开集步态识别方法 | |
RU2191429C1 (ru) | Способ автоматизированной диагностики заболеваний и их форм | |
CN117315379B (zh) | 面向深度学习的医学影像分类模型公平性评估方法及装置 | |
Cosma et al. | Identifying the presence of prostate cancer in individuals with PSA levels< 20 ng mL− 1 using computational data extraction analysis of high dimensional peripheral blood flow cytometric phenotyping data | |
Yang et al. | Unsupervised clustering and analysis of contraction-dependent fetal heart rate segments | |
CN116029960A (zh) | 辅助诊断方法、图像处理模型及存储介质 | |
CN116030957A (zh) | 知识图谱构建方法、装置、辅助诊断设备及存储介质 | |
Abad et al. | Detecting uncertainty of mortality prediction using confident learning | |
Mayo | An objective theory of statistical testing | |
Feng et al. | Discovering causalities from cardiotocography signals using improved convergent cross mapping with Gaussian processes | |
Sankaravadivel et al. | Feature based analysis of endometriosis using machine learning | |
Vimalajeewa et al. | A Method for Detecting Murmurous Heart Sounds based on Self-similar Properties | |
CN117524456A (zh) | 辅助诊断方法及系统 | |
Sherif et al. | A Machine Learning Approach for Stroke Differential Diagnosis by Blood Biomarkers | |
Çüm | Examining the discrimination of binary scored test items with ROC analysis | |
Shafi et al. | Application of machine learning models for detecting mental stress during COVID-19 pandemic |