RU2729458C2 - Сопоставление больниц из обезличенных баз данных здравоохранения без очевидных квазиидентификаторов - Google Patents
Сопоставление больниц из обезличенных баз данных здравоохранения без очевидных квазиидентификаторов Download PDFInfo
- Publication number
- RU2729458C2 RU2729458C2 RU2018119771A RU2018119771A RU2729458C2 RU 2729458 C2 RU2729458 C2 RU 2729458C2 RU 2018119771 A RU2018119771 A RU 2018119771A RU 2018119771 A RU2018119771 A RU 2018119771A RU 2729458 C2 RU2729458 C2 RU 2729458C2
- Authority
- RU
- Russia
- Prior art keywords
- databases
- data
- patient
- anonymized
- database
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/122—File system administration, e.g. details of archiving or snapshots using management policies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Группа изобретений относится к средствам обработки данных различного типа. Технический результат заключается в повышении быстродействия обработки и защищенности данных. В способе объединяют две или более обезличенных баз данных (X, Y) здравоохранения. Каждая обезличенная база данных здравоохранения имеет персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинских учреждений. При объединении баз данных статистические распределения характеристик пациентов рассчитываются для заполнителей для медицинских учреждений в обезличенных базах данных здравоохранения. Заполнители для медицинских учреждений в разных обезличенных базах данных здравоохранения сопоставляют путем установления соответствия между соответствующими статистическими распределениями характеристик пациентов для соответствующих заполнителей для медицинских учреждений. Пациенты в разных обезличенных базах данных здравоохранения сопоставляются путем соотнесения сопоставляемых пар заполнителей для соответствующих медицинских учреждений, что повышает эффективность вычислений. При этом формируется таблица (16) совмещения баз данных, идентифицирующая сопоставленных пациентов, или формируется объединенная обезличенная база данных здравоохранения, которая объединяет характеристики пациентов в разных обезличенных базах данных здравоохранения для каждого сопоставленного пациента в единую запись пациента с учетом медицинских учреждений. 3 н. и 17 з.п. ф-лы, 4 ил.
Description
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение в общем относится к медицинским исследованиям и разработкам, медицинским базам данных, интеллектуальному анализу медицинских данных и подобным областям.
УРОВЕНЬ ТЕХНИКИ
В многочисленных областях медицинских научных исследований и разработок используются базы данных здравоохранения, содержащие медицинские данные пациентов. Истории болезни или другие клинические данные, данные о выставлении счетов пациентам, административные записи, относящиеся к таким вопросам, как занятость больничных койко-мест и т. п., ведут больницы или иные медицинские учреждения и/или отдельные больничные отделения, такие как отделение кардиологии (ОК), отделение интенсивной терапии (ОИТ) или отделение неотложной госпитализации. Эти базы данных хранят конфиденциальные данные пациентов, которые обычно должны держаться в секрете в соответствии с законами о финансовой и/или медицинской тайне, такими как (в США) «Закон о преемственности страхования и отчетности в области здравоохранения» (HIPAA).
Вместе с тем признано, что такие базы данных являются ценным источником информации для выполнения широкого диапазона аналитических обработок медицинских данных для клинических, больнично-административных или иных целей. Известно, что для обеспечения возможности использования базы данных пациентов в таких целях при сохранении конфиденциальности пациентов, базу данных обезличивают путем удаления персональных данных пациентов. Информация, которую требуется обезличить, включает в себя имя, фамилию, отчество и/или идентификационный номер пациента (соответствующим образом заменяемые назначенным случайным образом номером и т. п.), адрес и т. д. Однако обезличивать следует и другую информацию, которая в совокупности является персональными данными. Например, согласно оценкам, сочетание пола, даты рождения и пятизначного почтового индекса позволяют однозначно идентифицировать 87% населения США. Поскольку пол и дата рождения, вероятно, будут полезны для многих медицинских анализов, эти результаты исследования предполагают, что почтовый индекс следует считать персональными данными, которые следует обезличивать.
Сведения о больнице тоже могут быть персональными данными в сочетании с другими сведениями, и их следует обезличивать путем замены идентификатором, выбранным случайным образом. Сведения о медицинском учреждении (например, больнице, больничном отделении) обычно не удаляют полностью, а, заменяют выбранным случайным образом идентификатором для каждой больницы (или клинического отделения, или другого медицинского учреждения), поскольку многие методы медицинской аналитики используют корреляции с медицинским учреждением. Например, доля успешных результатов пересадок сердца может сильно коррелировать с больницей или кардиологическим отделением.
Даже при вышеуказанном обезличивании определенные «редкие» пациенты все равно могут быть идентифицированы по обезличенным данным. Например, рассмотрим пациента мужского пола, который умер в возрасте 115 лет в больнице в США в 2011 г. Хотя этого сочетания (пола, возраста, даты смерти) может, как правило, оказаться недостаточно для однозначной идентификации пациента, очень большой возраст данного конкретного пациента при его смерти может сделать однозначную идентификацию возможной, поскольку пациентов мужского пола, умерших в возрасте 115 лет в США в конкретном году, может быть всего лишь несколько, или даже один. Аналогичным образом, основной диагноз очень редкой болезни может быть однозначно идентифицирующим в сочетании всего лишь с несколькими демографическими данными. Соответственно, при обезличивании возможно дополнительное удаление редких атрибутов пациента, которые могут быть персональными данными в сочетании с общими демографическими сведениями. Например, удаление таких «нечасто встречающихся» персональных данных может включать удаление возраста пациентов старше некоторого максимального возраста (например, старше 90 лет), удаление любого основного диагноза, которого нет в списке выбора (достаточно) распространенных диагнозов, и т. д.
Обезличенная база данных, тем не менее, обеспечивает большой объем информации для выполнения на нем различных видов анализа медицинских данных с обеспечением при этом конфиденциальности пациентов.
РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
Согласно одному из аспектов настоящего изобретения раскрыто устройство для обработки двух или более обезличенных баз данных здравоохранения, при этом каждая обезличенная база данных здравоохранения имеет персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями (плейсхолдерами) для медицинских учреждений. Устройство содержит электронный процессор, запрограммированный на выполнение процесса объединения баз данных, включающего следующие операции. Для каждого заполнителя для медицинского учреждения в обезличенных базах данных здравоохранения, - рассчитываются распределения статистических характеристик для набора характеристик пациентов по всем пациентам этого заполнителя медицинского учреждения. Заполнители для медицинских учреждений в одной обезличенной базе (X) данных сопоставляют с заполнителями для медицинских учреждений в другой обезличенной базе (Y) данных путем установления соответствия между статистическими распределениями характеристик, рассчитанными по всем пациентам соответствующих сопоставляемых заполнителей для медицинских учреждений. Для каждой сопоставленной пары заполнителей для медицинских учреждений в соответствующих обезличенных базах данных здравоохранения пациентов заполнителя для медицинских учреждений обезличенной базы (X) данных здравоохранения, сопоставляют с пациентами сопоставленного заполнителя для медицинских учреждений другой базы (Y) данных здравоохранения путем сопоставления характеристик пациентов соответствующих сопоставляемых пациентов.
Согласно еще одному аспекту настоящего изобретения раскрыт некратковременный носитель, хранящий инструкции, исполняемые электронным устройством обработки данных для выполнения процесса объединения баз данных, который объединяет две или более обезличенные базы данных здравоохранения. Каждая обезличенная база данных здравоохранения имеет персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинских учреждений. Процесс объединения баз данных включает:
расчет статистических распределений характеристик пациентов по всем заданным интервалам времени для заполнителей для медицинских учреждений в обезличенных базах данных здравоохранения;
сопоставление заполнителей для медицинских учреждений в обезличенной базе X данных здравоохранения и обезличенной базе Y данных путем установления соответствия между статистическими распределениями характеристик пациентов для соответствующих заполнителей медицинских учреждений;
сопоставление пациентов в обезличенной базе X данных здравоохранения и обезличенной базе Y данных здравоохранения в сопоставленных парах заполнителей для медицинских учреждений; и
формирование одного из (i) таблицы совмещения баз данных, идентифицирующей сопоставленных пациентов, и (ii) объединенной обезличенной базы данных здравоохранения, которая объединяет характеристики пациентов в обезличенных базах X, Y данных здравоохранения для каждого сопоставленного пациента в единую запись пациента.
Согласно другому аспекту настоящего изобретения раскрыт способ, который объединяет две или более обезличенных баз данных. Каждая обезличенная база данных здравоохранения имеет персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинских учреждений. Способ объединения баз данных включает:
расчет статистических распределений характеристик пациентов для заполнителей для медицинских учреждений в обезличенных базах данных здравоохранения;
сопоставление заполнителей для медицинских учреждений в разных обезличенных базах данных здравоохранения путем сопоставления статистических распределений характеристик пациентов для соответствующих заполнителей для медицинских учреждений;
сопоставление пациентов в разных обезличенных базах данных здравоохранения, причем сопоставление пациентов выполняют в сопоставленных парах заполнителей для медицинских учреждений; и
формирование таблицы совмещения баз данных, идентифицирующей сопоставленных пациентов, или объединенной обезличенной базы данных здравоохранения, которая объединяет характеристики пациентов в различных обезличенных базах данных здравоохранения для каждого сопоставленного пациента в единую запись пациента.
Способ объединения баз данных соответствующим образом реализуется компьютером.
Одно из преимуществ заключается в обеспечении для выполнения аналитической обработки медицинских данных более крупных баз данных путем объединения или комбинирования двух или более обезличенных баз данных здравоохранения.
Другим преимуществом является обеспечение для выполнения аналитической обработки данных баз данных с более разнообразной информацией (например, сочетающих клинические и финансовые данные) путем объединения или комбинирования двух или более обезличенных баз данных здравоохранения.
Еще одно преимущество заключается в обеспечении вышеуказанных преимуществ с сохранением конфиденциальности пациентов.
Данный вариант реализации может не обеспечивать или обеспечивать одно, два, более или все из вышеупомянутых преимуществ и/или может обеспечивать другие преимущества, которые будут понятны специалисту в данной области после прочтения и осмысления настоящего описания.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Изобретение может быть реализовано в виде различных компонентов или групп компонентов, а также различных этапов или схем организации этапов. Чертежи представлены исключительно в целях иллюстрации предпочтительных вариантов реализации и не должны рассматриваться как ограничивающие изобретение.
На ФИГ. 1 схематически изображена система медицинской аналитической обработки, которая использует данные пациентов, объединенные из двух обезличенных баз данных здравоохранения.
На ФИГ. 2 схематически изображена система для формирования таблицы совмещения баз данных системы медицинской аналитики, показанной на ФИГ. 1.
На ФИГ. 3 приведен пример таблицы выбора характеристики.
На ФИГ. 4 приведен пример распределения возраста для медицинского учреждения.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Как уже было отмечено, обезличенная база данных здравоохранения может предоставлять большой информационный массив для выполнения на нем самых разных аналитических обработок медицинских данных с обеспечением при этом конфиденциальности пациентов. Для того чтобы оценить значение обезличенной базы данных здравоохранения, отмечается, что такая база данных может, в некоторых случаях, содержать данные свыше миллиона пациентов или более. Такая база данных является ценным источником для интеллектуального анализа различных корреляций, статистических закономерностей, трендов и т. д.
Тем не менее, недостатком, отмеченным в настоящем описании, является то, что данные, содержащиеся в обезличенной базе данных здравоохранения, обычно ограничиваются данными, которые доступны одной организации или группе. Например, можно обезличить электронную медицинскую запись (EMR), содержащую клинические данные для всех пациентов, обращавшихся в сеть больниц, чтобы обеспечить большую базу данных здравоохранения, содержащую клинические данные. Аналогичным образом, в той же самой сети больниц возможно наличие административного отдела, который может формировать обезличенную больничную административную базу данных, содержащую информацию о коэффициентах занятости коек, нагрузке медсестер и т.д. Однако в некоторых случаях формирование комбинированной обезличенной базы данных здравоохранения, которая объединяет базу данных EMR и больничную административную базу данных этой сети больниц, может оказаться невозможным. Такое объединение может выполняться путем получения доступа к обеим базам данных для осуществления синхронизированного обезличивания, но HIPAA или другие законы о конфиденциальности не разрешают такого широкого доступа. Возможно, для создания такой комбинированной обезличенной клинической/административной базы данных также потребуется сотрудничество между отделениями, но такого сотрудничества может и не быть. В результате медицинские научно-исследовательские работники могут иметь доступ только к обособленным обезличенной базе данных EMR и обезличенной административной базе данных. Если научно-исследовательский проект требует объединения клинических и больнично-административных данных, этих обособленных обезличенных баз данным может оказаться недостаточно.
Аналогичные проблемы могут возникать в других ситуациях. Например, две различные сети больниц сети могут независимо создать обезличенные клинические базы данных на основе своих соответствующих систем EMR. Однако они не могут создать комбинированную обезличенную базу данных EMR, так как каждая сеть больниц запрещает доступ к EMR другой сети больниц. В результате дополнительная информация, которая могла бы быть получена из анализа пациентов, которым оказывались медицинские услуги в обеих сетях больниц, утрачивается из-за независимых процессов обезличивания.
В настоящем изобретении предложены подходы для преодоления этих трудностей. В частности, предложенные в настоящем изобретении подходы объединяют две или более обезличенные базы данных здравоохранения после того, как они обезличены. Другими словами, система объединения обезличенных баз данных, предложенная в настоящем изобретении, имеет доступ только к обезличенным базам данных и не нуждается в доступе к базовым необезличенным данным пациентов. Таким образом, предложенные в настоящем изобретении методы могут быть применены для комбинирования любых двух или более обезличенных баз данных вне зависимости от наличия у владельца системы объединения баз данных доступа к базовым необезличенным данным. Кроме того, предложенные подходы не опираются на деобезличивание или повторную идентификацию обезличенных данных. Они не используют, например, перекрестную ссылку на необезличенные источники данных для повторной идентификации обезличенных данных. Следовательно, конфиденциальность пациентов сохраняется при объединении обезличенных баз данных здравоохранения.
На ФИГ. 1 показаны две обезличенные базы здравоохранения, обозначенные как «База X данных» и «База Y данных». Обезличенная база X данных здравоохранения формируется средством 6 обезличивания данных, а обезличенная база Y дынных формируется средством 8 обезличивания данных. Средства 6, 8 обезличивания предпочтительно автоматизированы (например, реализованы на компьютерах, причем компьютеры запрограммированы на удаление определенных классов или типов данных), чтобы обезличивать большие базы данных, например, миллион записей пациентов в некоторых вариантах реализации. Необязательно, одно или оба из средств 6, 8 обезличивания могут также включать в себя какую-либо ручную обработку, например, удаление определенных редких пациентов или урегулирования других необычных ситуаций. Эти два средства 6, 8 обезличивания могут быть идентичными или неидентичными, и могут обезличивать одну и ту же или различную информацию. В некоторых вариантах реализации каждое средство 6, 8 обезличивания обезличивает персональные данные, которые могут непосредственно идентифицировать пациента, такие как имя, фамилия и отчество пациента, адрес пациента и т.д., а также информацию, которая может быть потенциально персональными данными в сочетании с другой информацией, такую как название больницы, почтовый индекс и т.д. Когда информация может быть персональными данными в сочетании с другой информацией, может потребоваться обезличивать только часть этого сочетания. Например, сочетание почтового индекса, пола и даты рождения может быть персонально идентифицирующим, но за счет обезличивания только информации о почтовом индексе можно достичь приемлемой анонимности пациента. Средства 6, 8 обезличивания могут также удалять редкую информацию, которая может быть идентифицирующей для определенных пациентов. К такой редкой информации можно отнести, например, любой возраст выше определенного максимума, например 90 лет; диагнозы, которые не входят в список наиболее распространенных диагнозов, и т.д.
В целом, обезличивание конкретных данных может быть выполнено путем удаления (изъятия) данных или путем замены данных заполнителем, причем последний вариант предпочтительнее в ситуациях, когда корреляции с этим конкретным типом информации желательно сохранить, хотя и с обезличиванием. Например, в предложенных методах предполагается, что записи медицинского учреждения (например, больницы или больничного отделения) заменяются заполнителями, которые внутренне согласованы для базы данных. Эти заполнители внутренне согласованы с конкретной базой данных, но меняются по существу случайным образом между базами данных. Например, в базе X данных больница общего профиля N-ска может всегда заменяться заполнителем «8243», а городской медицинский центр M-ска может всегда заменяться заполнителем «1238». В этом примере каждый экземпляр медицинского учреждения «Больница общего профиля N-ска» в базе X данных заменяется (одним и тем же) заполнителем для медицинского учреждения «8243», а каждый экземпляр медицинского учреждения «Городской медицинский центр M-ска» в базе X данных заменяется (одним и тем же) заполнителем для медицинского учреждения «1238». С другой стороны, в продолжение примера для базы Y, каждый экземпляр медицинского учреждения «Больница общего профиля N-ска» базы Y данных может быть заменен одним и тем же заполнителем для медицинского учреждения «EADF» (который отличается от заполнителя «8243», используемого для N-ска в базе X данных), а каждый экземпляр «Городской медицинский центр M-ска» может быть заменен одним и тем же заполнителем для медицинского учреждения «JSDF» (который тоже отличается от заполнителя «1238», используемого для M-ска в базе X данных). Такое обезличивание медицинского учреждения с помощью заполнителей для медицинских учреждений, которые согласуются внутри обезличенной базы данных, позволяет медицинской аналитике, действующей на базе данных, идентифицировать корреляции с конкретным медицинским учреждением при сохранении анонимности. Например, если в N-ске статистически более значимая доля успешных пересадок сердца, чем в средней больнице, это проявится в базе X данных (в предположении, что она хранит данные по результатам пересадок сердца) в виде статистически более значимой доли успешных пересадок сердца, выполненных в обезличенной больнице «8243».
С другой стороны, некоторая информация может быть обезличена путем изъятия, то есть удаления. Например, информация об адресе места жительства может быть изъята полностью, поскольку она является в высокой степени идентифицирующей, а полезные корреляции с адресом места жительства не предполагаются. В альтернативном варианте реализации, если корреляции с адресом места жительства полагаются полезными входными данными для аналитической обработки медицинских данных, обезличивание адреса можно выполнить путем замены адреса места жительства более широкой географической единицей, например, городом проживания, если численность населения этого города достаточно большая. Город или район с достаточно малочисленным населением могут быть изъяты полностью во избежание сохранения «редких» данных, которые могли бы персонально идентифицировать, или могут быть заменены подходящей более крупной географической единицей, такой как область проживания.
Каждая из обезличенной базы X данных и обезличенной базы Y данных отформатирована в некотором структурированном формате, например, в формате реляционной базы данных или в другом структурированном формате базы данных, таком как электронные таблицы, выполненные с возможностью поиска, редактируемые текстовые файлы с разделителями-колонками и т. д. Обезличенная база X данных и обезличенная база Y данных или их объединенная комбинация, как описано в настоящем документе, доступны для системы аналитической обработки медицинских данных, реализованной на компьютере 10, который может быть, например, сетевым серверным компьютером, облачным вычислительным ресурсом, кластером серверов и т.д. Компьютер 10 для аналитической обработки медицинских данных выполняет по меньшей мере один процесс 12 аналитической обработки медицинских данных, который осуществляет поиск содержимого одной или обеих обезличенных баз X, Y данных для выявления в этих данных корреляций, статистических закономерностей, трендов и т.д., которые могут представлять интерес для улучшения клинических результатов, эффективности административного руководства больницы, финансовой эффективности и т.д., или которые могут представлять интерес для обнаружения плохих клинических результатов, административной и/или финансовой неэффективности и т.д. Процесс аналитической обработки медицинских данных может быть реализован в виде специально разработанной компьютерной программы или может быть построен в кодированном формате высокого уровня, например, в виде запроса на языке структурированных запросов (SQL) или в виде SQL-программы в вариантах реализации, где обезличенные базы X, Y данных являются реляционными базами данных системы управления реляционными базами данных (RDBMS). В дополнение к извлечению данных из одной или обеих баз X, Y данных процесс 12 аналитической обработки медицинских данных может выполнять широкий диапазон статистических, графических или иных операций обработки данных, таких как вычисление статистического математического ожидания, среднего значения, стандартного отклонения или дисперсии либо других статистических характеристик данных, нанесение данных на график с использованием различных форматов (гистограмма, секторная диаграмма, линия тренда и т.д.) и т.п.
Как показано на ФИГ. 1, процесс 12 аналитической обработки медицинских данных включает в себя или имеет доступ (например, посредством вызова функции, вызова подпрограммы, указателя-связки и т.п.) к компоненту 14 извлечения из базы данных пациентов, который извлекает из одной или обеих баз X, Y данных данные, удовлетворяющие некоторому критерию запроса (например, определенному с помощью SQL-запроса). Если процесс 12 аналитической обработки медицинских данных имеет доступ только к обезличенной базе X данных или только к обезличенной базе Y данных, то компонент 14 извлечения из базы данных пациентов может непосредственно обращаться к соответствующей базе.
С другой стороны, для получения доступа к объединенным обезличенным базам X, Y данных компонент 14 извлечения из базы данных пациентов ссылается на таблицу 16 совмещения баз данных, которая сопоставляет обезличенных пациентов в двух базах X, Y данных и комбинирует данные сопоставленных пациентов из двух баз X, Y данных. Если обе записи сопоставленных пациентов в соответствующих базах X, Y данных хранят одно и то же значение для характеристики пациентов, то извлеченное значение для этой характеристики пациентов будет этим общим значением. Если только одна из записей сопоставленных пациентов в соответствующих базах X, Y данных хранит значение для характеристики пациентов, то извлеченное значение для этой характеристики пациентов будет этим одним хранимым значением. Если записи сопоставленных пациентов в соответствующих базах X, Y данных хранят разные значения для характеристики пациентов, это несоответствие можно разрешить различными путями, такими как возвращение среднего значения двух значений или возвращение значения ошибки для этой характеристики пациентов. В одном подходе среднее значение возвращается, если два разных сохраненных значения достаточно близки (например, в пределах назначенного процентного значения), тогда как значение ошибки возвращается, если эти два значения отличаются больше, чем на это пороговое процентное значение.
Объединение баз X, Y данных может быть полезными, если, например, база X данных и база Y данных хранят различную информацию для данного обезличенного пациента. В качестве иллюстрации, если обезличенная база X данных является клинической базой данных, а обезличенная база Y данных является больнично-административной базой данных, то для пациента может быть получена комбинация медицинской процедуры, выполненной над пациентом (из базы X данных), и характеристик операционного блока, в котором выполнялась операция (из базы Y данных), которая позволяет получать аналитические данные, такие как влияние хирургического оборудования на результаты медицинской процедуры. Преимуществом является то, что таблица 16 совмещения баз данных сама обезличена в том смысле, что она не идентифицирует никакого пациента или не опирается на персональные данные при совмещении пациентов двух обезличенных баз X, Y данных. Более того, построение таблицы 16 совмещения баз данных не опирается на процедуры деобезличивания или повторной идентификации.
Вообще, компьютер 10 для аналитической обработки медицинских данных не имеет доступа к исходной (-ым) базе (-ам) данных, из которой (-ых) обезличенные базы X, Y данных формируются средствами 6, 8 обезличивания. Это схематически показано на ФИГ. 1 путем помещения средств 6, 8 обезличивания за пределами компьютера 10 для аналитической обработки медицинских данных и отображения средств 6, 8 обезличивания пунктирными линиями. В более общем смысле базы X, Y данных обезличены, и процесс 12 аналитической обработки медицинских данных не имеет доступа к базовым необезличенным данным. (Например, предполагается, что исходные необезличенные базы данных доступны компьютеру 10 для аналитической обработки медицинских данных, но защищены от доступа процесса 12 аналитической обработки медицинских данных с использованием подходящих процедур защиты электронных данных, например, с помощью уровней доступа к данным, защиты паролем, шифрования и т.д.)
Система для формирования таблицы 16 совмещения баз данных описана со ссылкой на ФИГ. 2 Система на ФИГ. 2 содержит компьютер 10, выполняющий процесс 20 объединения, который объединяет две обезличенных базы X, Y данных путем формирования таблицы 16 совмещения баз данных. На иллюстративной ФИГ. 2 процесс 20 объединения реализован на том же самом компьютере 10, который также выполняет процесс 12 аналитической обработки медицинских данных; однако это не является обязательным требованием и предлагается вместо выполнения процесса 20 объединения на другом компьютере, а не на компьютере, который выполняет процесс 12 аналитической обработки медицинских данных. Как и в случае процесса 12 аналитической обработки медицинских данных, процесс 20 объединения также не имеет доступа к базовым необезличенным данным. Например, предполагается, что исходные необезличенные базы данных доступны компьютеру 10 для аналитической обработки медицинских данных, но защищены от доступа процесса 20 объединения с использованием подходящих процедур защиты электронных данных, например, с помощью уровней доступа к данным, защиты паролем, шифрования и т. д. В альтернативном варианте реализации, исходные необезличенные базы данных могут быть вообще недоступны компьютеру 10. Процесс 20 объединения выполняет объединение обезличенных баз X, Y данных, то есть формирует таблицу 16 совмещения баз данных, используя только информацию, содержащуюся в обезличенных базах X, Y данных. Можно также отменить, что хотя в иллюстративном варианте реализации результатом процесса 20 объединения является таблица 16 совмещения баз данных, в других вариантах осуществления результатом может быть фактическая объединенная база данных, которая содержит единую запись пациента для каждой сопоставленной пары пациентов в двух базах X, Y данных, содержащую всю (объединенную) информацию из баз X, Y данных для сопоставленной пары пациентов. (То есть сформированная объединенная обезличенная база данных здравоохранения объединяет характеристики пациентов в обезличенных базах X, Y данных здравоохранения для каждого сопоставленного пациента в единую запись пациента.)
В принципе, две базы X, Y данных могут быть объединены с помощью исчерпывающего поиска. В этом исчерпывающем подходе, начиная с первой записи базы X данных, выполняют поиск каждой записи базы Y данных, и ту запись базы Y данных, которая наиболее близко совпадает с первой записью базы X данных, сопоставляют первой записи базы X данных (необязательно, только в том случае, если совмещение удовлетворяет некоторому минимальному пороговому значению). Это повторяется для второй записи базы X данных и т. д. до тех пор, пока все записи базы X данных не будут обработаны. Однако этот исчерпывающий подход требует большого объема вычислений. Например, если база X данных и база Y данных обе содержат по одному миллиону записей, то выполнение исчерпывающего поиска потребует сравнения записей.
В подходах с объединением, предложенных в настоящем изобретении, это затруднение с вычислениями преодолевается с помощью следующего подхода. В настоящем описании принимается, что в большинстве обезличенных баз данных медицинские учреждения (например, больницы или отделения больницы) обезличены путем замены каждого медицинского учреждения внутренне согласованным заполнителем (например, каждый экземпляр больницы в конкретной обезличенной базе данных заменен одним и тем же заполнителем). Заполнители эффективно сохраняют возможность выявлять корреляции, статические тренды и т.п. на уровне больницы или отделения больницы. Такие корреляции, тренды и т. д. невозможно было бы выделить, если название больницы было бы изъято. Кроме того, использование внутренне согласованных заполнителей для медицинских учреждений при обезличивании медицинских учреждений может облегчить выполнение аудита, если средство контроля (которое не является процессом 12 аналитической обработки медицинских данных и не является процессом 20 объединения), собирает и сохраняет информацию, в которой каждому заполнителю для медицинского учреждения соответствует фактическое медицинское учреждение. Таким образом, если процесс 12 аналитической обработки медицинских данных был бы предназначен (в качестве иллюстрации) для выявления в данной больнице некой проблемы, которая влияет на безопасность пациентов, то можно было бы обратиться к этому средству контроля, чтобы идентифицировать данную больницу и решить проблему, связанную с безопасностью.
В подходах с объединением, предложенных в настоящем изобретении, медицинские учреждения, обезличенные с помощью внутренне согласованных заполнителей для медицинских учреждений, используются для сопоставления соответствующих медицинских учреждений в разных обезличенных медицинских базах X, Y данных. Такое сопоставление меньше на несколько порядков величины по сложности, чем исчерпывающее сопоставление по каждому пациенту. Например, иллюстративный пример с одним миллионом пациентов в каждой базе X, Y данных может соответствовать (в качестве иллюстрации) 2000 больницам (или, более точно, 2000 заполнителям для больниц) для каждой базы X, Y, если вклад каждой больницы составляет в среднем 500 записей пациентов. Тогда сопоставление больниц влечет или четыре миллиона сравнений (по сравнению с одним триллионом сравнений при исчерпывающем поиске для каждого пациента, что равносильно снижению сложности примерно на пять порядков величины). Когда больницы сопоставлены, сопоставление пациентов выполняют для каждой пары сопоставленных больниц в базах X, Y данных. В рассматриваемом примере каждая больница в среднем имеет 500 записей пациентов, что влечет лишь около сравнений на больницу. Поэтому объединение баз X, Y данных легко разрешимо даже для больших баз данных.
Как показано на ФИГ. 2, иллюстративный процесс 20 объединения включает следующие операции. В операции 22 критерии включения/исключения применяются для выбора в базах X, Y данных соответствующих частей баз данных, подлежащих объединению. Операция 22 может также включать стандартизацию формата данных, перевод единиц измерения или другую предварительную обработку. В операции 24 определяется набор характеристик пациентов для использования в сопоставлении медицинских учреждений. В операции 26 для каждого медицинского учреждения рассчитывается статистическое распределение (например, функция распределения вероятностей) каждой характеристики пациентов по всем пациентам этого медицинского учреждения. Распределения характеристик могут быть, необязательно, рассчитаны на годовой основе (или на основе некоторых иначе определенных интервалов времени, например, на двухлетней основе, на месячной основе и т. д.) При таком подходе сравнения профилей распределения характеристик для различных медицинских учреждений выполняются на интервалах времени, для которых в обеих базах X, Y данных имеются данные пациентов. Распределения характеристик могут, необязательно, быть моделированы, например, путем аппроксимации с получением гауссовской модели, аппроксимации с получением сплайновой кривой или другой параметризованной модели, чтобы сократить число значений, представляющих каждое распределение (например, гауссовская модель параметризируется по значениям амплитуды, математического ожидания и дисперсии), и/или облегчить сравнение аналитических распределений, и/или получить возможность обработки распределений характеристик пациентов как гладких непрерывных функций. Операция 26 формирует набор (по каждому году) профилей распределения характеристики (необязательно, представленных моделью), представляющих различные медицинские учреждения (или, более точно, заполнители для медицинских учреждений), и эти профили распределения характеристик пациентов затем используются в операции 30 для сопоставления медицинских учреждений в соответствующих базах X, Y данных с помощью схожих профилей распределения характеристик пациентов. Операция 30 основана на ожидании того, что распределения характеристик пациентов популяции пациентов, (основанной на годичном или ином интервале времени) должны быть аналогичны для двух баз X, Y данных, поскольку обе базы X, Y данных регистрируют данные во многом одних и тех же пациентов. Операция 30 выполняет дальнейшую рационализацию на основе ожидания того, что даже если некоторые пациенты, зарегистрированные в базе X данных за конкретным медицинским учреждением, не зарегистрированы в базе Y данных за этим медицинским учреждением (или наоборот), то базовые демографические данные пациентов, обслуживаемых медицинским учреждением, являются теми же самыми, так что распределения характеристик должны быть аналогичными. Когда медицинские учреждения (или, более точно, заполнители для медицинских учреждений) соответствующих баз X, Y сопоставлены, в операции 32 сопоставляют пациентов (или записи пациентов) в каждой сопоставленной паре медицинских учреждений соответствующих баз X, Y данных. Операция сопоставления 32 может быть выполнена исчерпывающим образом, поскольку, как уже объяснялось, операцию 32 сопоставления пациентов выполняют на меньших подмножествах пациентов в базах X, Y данных.
Далее каждая из этих операций — 22, 24, 26, 30, 32 — описывается более подробно и/или на иллюстративных примерах.
Операция 22 применяет критерии включения и исключения. Чтобы сопоставить больницы (или другие медицинские учреждения) из двух разных больших обезличенных баз X, Y данных здравоохранения, подмножества этих двух баз данных, которые, возможно, связаны, выделяются в операции 22. Например, если одна база данных охватывает только данные пациентов хирургического и ожогового отделений интенсивной терапии ОИТ из другой базы данных, то, соответственно, рассматривается подмножество пациентов, которые во время госпитализации были приняты в хирургическое и ожоговое отделения ОИТ (ICU). Операция 22 может, необязательно, включать другие предварительные обработки, такие как стандартизация представлений данных.
Операция 24 выбора характеристики идентифицирует подмножество характеристик, идентифицирующих не единственным образом (так как базы X, Y данных обезличены), для которых могут быть сформированы приемлемо точные функции плотности вероятностей или другие статистические распределения. Идентифицированный набор характеристик пациентов используется в последующем сопоставлении медицинских учреждений. Для включения в набор характеристик пациентов характеристика должна присутствовать в обеих базах X, Y данных. Некоторые потенциально пригодные характеристики сведены в таблицу на ФИГ. 3. Кроме того, авторы настоящего изобретения обнаружили, что некоторые обезличенные базы данных здравоохранения содержат высокие проценты или доли неточной информации по определенным характеристикам пациентов, очевидно из-за ошибок ввода и/или транскрибирования данных, причем характеристики пациентов с существенной неточностью предпочтительно не включаются в набор характеристик пациентов, используемых для статистического описания медицинских учреждений. Хотя обезличивание затрудняет оценку точности, для оценки (статистическим образом) точности данной характеристики в данной обезличенной базе данных могут быть использованы различные подходы. Например, если пациент указан как имеющий пол «мужской» и основной диагноз «беременность», то один или оба этих элементов данных неверны. Невероятные значения характеристики могут быть также признаны ошибочными, например, возраст пациента 200 лет. Невероятные распределения характеристик тоже могут быть признаны ошибочными, например, если (заполнитель) больница имеет срок пребывания 30 суток для каждого пациента, то это почти наверняка ошибка данных. В целях выбора характеристики опускаемое значение характеристики может, необязательно, рассматриваться как «ошибка», так как отсутствующие данные характеристики снижают полезность характеристики пациента для охарактеризования медицинских учреждений. Например, если возраст зарегистрирован только для двух третей пациентов, это высокий процент ошибок, который снижает полезность возраста для охарактеризования медицинских учреждений.
На ФИГ. 3, например, в качестве возможного примера использования точности баз X, Y данных для различных потенциальных характеристик сведены в таблицу. Как показано на ФИГ. 3, база X данных демонстрирует низкую точность в 80% для пола (т. е. 20% записей пола определены как неверные), тогда как база Y данных имеет низкую точность в 71% для основного диагноза (т.е. 29% основных диагнозов определены как неверные). Все остальные точности характеристик, сведенные в таблицу на ФИГ. 3, превышают 90%. Таким образом, из таблицы на ФИГ. 3 идентифицированы характеристики «раса», «смертность», «срок пребывания», «возраст» и «вес тела», но не «пол» и не «основной диагноз». В более общем смысле, чтобы характеристика была выбрана в операции 24, точность этой характеристики в обеих базах X, Y данных должна быть высокой.
Операция 26 рассчитывает статистические распределения для характеристик, идентифицированных в операции 24. На ФИГ. 4 показан пример возможного использования функции распределения вероятностей для возраста. В этом иллюстративном примере возраст пациентов сгруппирован по девяти возрастным интервалам, охватывающим диапазон возрастов 20–80 лет, чтобы сформировать гистограмму, вид которой напоминает кривую колоколообразной формы. Необязательно, гистограмму можно аппроксимировать параметризованной моделью, как показано линией на ФИГ. 4, такой как гауссовская модель, аппроксимировать сплайновой кривой и т. п., чтобы сократить число параметров и/или облегчить аналитический расчет, и/или сделать возможной обработку статистических распределений характеристик как гладких, непрерывных функций.
Операция 30 сопоставления заполнителей для медицинских учреждений сопоставляет заполнители для медицинских учреждений в одной обезличенной базе X данных с заполнителями для медицинских учреждений в другой обезличенной базе Y данных путем установления соответствия между статистическими распределениями характеристик, рассчитанными по всем пациентам соответствующих сопоставляемых заполнителей для медицинских учреждений. В одном иллюстративном подходе операция 30 сопоставления медицинского учреждения соответствующим образом применяет статистический критерий, такой как критерий Коломогорова-Смирнова, критерий хи-квадрат и т.д., для расчета мер подобия для соответствующих распределений характеристики двух (заполнителей) медицинских учреждений в соответствующих базах X, Y. Критерий Коломогорова-Смирнова или критерий хи-квадрат формирует значение вероятности (p-значение) в предположении, что обе сформированные функции распределения вероятности каждой характеристики за определенный год (например) для больницы A из базы X данных и больницы B их базы Y данных принадлежат одному и тому же распределению. Мера подобия между больницей A и больницей B за определенный год может быть создана путем перемножения p-значений набора характеристик для этого же года (в следующем примере используется 2010 год). Например, если (как на иллюстративной ФИГ. 3) в операции 24 выбраны пять характеристик («раса», «смертность», «срок пребывания», «возраст» и «вес тела»), мера подобия между больницей A и больницей B в 2010 году будет равна , где верхний индекс указывает характеристику пациентов, а нижний индекс определяет год (или другой заданный интервал времени, на котором рассчитываются профили распределения). Затем, для каждого года, больницы из двух баз X, Y данных связываются на основании наивысших значений мер подобия среди всех пар. Два (заполнителя) медицинских учреждений в соответствующих базах X, Y данных сопоставляют друг другу в операции 30, если их мера подобия превышает выбранный порог на некоторый процент от порогового значения сравниваемых лет (например, 75% от порогового значения сравниваемых лет в одном варианте реализации). Это всего лишь один иллюстративный критерий сопоставления, и предполагаются другие критерии согласования, рассчитываемые как совокупная мера подобия распределений характеристики в сравниваемых медицинских учреждениях.
После этого операция 32 сопоставления пациентов сопоставляет соответствующих пациентов в каждой сопоставленной паре медицинских учреждений в соответствующих базах X, Y данных, идентифицированной операцией 30 сопоставления медицинских учреждений путем установления соответствия между функциям пациентов соответствующих сопоставляемых пациентов. В исчерпывающем подходе, начиная с первого пациента больницы A в базе X данных, выполняют поиск каждого пациента больницы B в базе Y данных, и тот пациент больницы B в базе Y данных, характеристики пациентов которого наиболее близко совпадают с соответствующими характеристиками пациентов первого пациента больницы A в базе X данных, сопоставляют первому пациенту больницы A в базе X данных (необязательно, только в том случае, если совмещение удовлетворяет некоторому минимальному пороговому значению). Это повторяется для каждого последующего пациента больницы A в базе X данных до тех пор, пока все пациенты больницы A базы данных X не будут обработаны. Операция 32 сопоставления пациентов обычно использует те же самые характеристики пациентов, которые были идентифицированы в операции 24 для использования при сопоставлении медицинских учреждений, хотя это не существенно (например, в операции 32 сопоставления пациентов может быть использовано меньшее количество характеристик, либо могут быть использованы дополнительные или другие характеристики. В альтернативном подходе пациенты сначала группируются по интервалам, на которые разбивается выбранная характеристика, такая как возраст (возможно, с некоторым перекрытием интервалов), и сравнения выполняются для пациентов в соответствующих интервалах. Если интервалы выбраны надлежащим образом, это может сократить общее количество сравнений.
Полученные в результате сопоставления пациентов затем используются для построения таблицы 16 совмещения баз данных, например, путем сохранения таблицы подстановки, идентифицирующей пациентов в базе Y данных, которые соответствуют пациентам в базе X данных, и наоборот. В альтернативном варианте объединение может быть выполнено путем формирования новой объединенной базы данных, которая сочетает данные из соответствующих баз X, Y данных в соответствии с результатами операции 32 сопоставления пациентов.
Поскольку операция 30 сопоставления медицинских учреждений использует распределения характеристик, сформированные операцией 26, это сопоставление не зависит от наличия «редких» данных, которые иногда изымают из обезличенных баз данных (например, значения возраста свыше 90 лет, редкие основные диагнозы и т.д.). Чаще всего изъятие этих редких данных, если они соответствуют характеристикам, влияет на статистическую точность этих характеристик. Однако редкие значения по определению встречаются редко, и поэтому их изъятие вряд ли значительно скажется на статистической точности характеристики в базе данных (например, как показано в таблице на ФИГ. 3).
Как отмечено ранее, медицинские учреждения наиболее часто регистрируются как больницы, но могут, в качестве альтернативы, быть другими медицинским учреждениями, таким как сети больниц, отдельные больничные отделения и т. п. Также отмечено, что объединение баз X, Y данных может не сопоставить каждого пациента в базе X данных пациенту в базе Y данных, и наоборот. Это может произойти из-за отсутствия у пациента соответствующей пары в другой базе данных, или потому, что операции 32 не удалось найти соответствие с достаточной вероятностью. В случае несопоставленного пациента таблица 16 совмещения баз данных соответствующим образом сохраняет специальное значение (например, <null>), чтобы указать на отсутствие сопоставления.
Понятно также, что вышеуказанную обработку можно повторять для объединения трех (или более) баз данных здравоохранения. Могут быть использованы различные подходы. Например, если даны три базы X, Y и Z, обработка может включать: (i) объединение баз X, Y данных; (ii) объединение баз X, Z данных; и (iii) объединение баз Y, Z данных. Может быть выполнена необязательная проверка согласованности, например, если пациент A в базе X данных сопоставлен с пациентом M в базе Y данных в операции (i) и пациент A в базе X данных сопоставлен с пациентом F в базе Z данных в операции (ii), то для того, чтобы быть согласованной, операция (iii) должна сопоставлять пациента M в базе Y данных с пациентом F в базе Z данных.
Понятно, что раскрытые функциональные возможности процесса 12 аналитической обработки медицинских данных и/или процесса 20 объединения баз данных, приведенные в настоящем описании, могут быть реализованы в виде некратковременного носителя для хранения, хранящего инструкции, которые могут быть считаны и исполнены электронным процессором 10 для осуществления описанных функциональных возможностей. Некратковременный носитель для хранения может быть выполнен, например, в виде накопителя на жестком диске или другого магнитного запоминающего устройства, оптического диска или другого оптического запоминающего устройства, флэш-памяти, постоянного запоминающего устройства (ПЗУ) и другого электронного запоминающего устройства, их различных сочетаний и т.д.
Настоящее изобретение описано со ссылкой на предпочтительные варианты реализации. По прочтении и осмыслении предшествующего описания другими людьми могут появиться модификации и изменения настоящего изобретения. Подразумевается, что настоящее изобретение должно рассматриваться как включающее в себя все такие модификации и изменения в той мере, в какой они охвачены объемом прилагаемой формулы изобретения или ее эквивалентов.
Claims (52)
1. Устройство для обработки двух или более обезличенных баз (X, Y) данных здравоохранения, каждая из которых содержит персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинских учреждений, причем устройство содержит:
обезличенные базы (X, Y) данных здравоохранения, заполнители которых внутренне согласованы с конкретной базой данных,
электронный процессор (10), запрограммированный на выполнение процесса (20) объединения баз данных и выполненный с возможностью:
в процессе обработки медицинских данных осуществлять поиск содержимого одной или обеих баз данных (X, Y) и установление корреляций данных баз данных различных заполнителей, удовлетворяющих некоторому критерию запроса,
при обработке результатов поиска совмещать или комбинировать данные сопоставленных пациентов из двух баз (X, Y) данных, причем
если обе записи сопоставленных пациентов в соответствующих базах (X, Y) хранят одно и то же значение для характеристики пациентов, то извлеченное значение для этой характеристики будет этим общим значением,
в процессе объединения формировать таблицу совмещения баз данных или объединенную базу данных, используя только информацию, содержащуюся в обезличенных базах (X, Y) данных, которые содержат единую запись пациента для каждой сопоставленной пары пациентов в двух базах (X, Y) данных, таким образом, что сформированная объединенная обезличенная база данных здравоохранения объединяет характеристики пациентов в обезличенных базах (X, Y) данных здравоохранения для каждого сопоставленного пациента в единую запись пациента,
а устройство также содержит средство контроля, предназначенное для сбора и хранения информации в обезличенных базах (X, Y) данных по каждому заполнителю - медицинскому учреждению, для идентификации медицинского учреждения и соответствующих данных по этому медицинскому учреждению.
2. Устройство по п. 1, в котором процесс объединения баз данных дополнительно включает операцию формирования таблицы (16) совмещения баз данных, идентифицирующей сопоставленных пациентов.
3. Устройство по п. 2, в котором электронный процессор (10) дополнительно запрограммирован на выполнение операции извлечения данных, включающей:
ссылку на таблицу (16) совмещения баз данных для идентификации сопоставленных пациентов и
возврат объединенных характеристик пациентов, сохраненных для сопоставленных пациентов в соответствующих базах (X, Y) данных.
4. Устройство по п. 1, в котором процесс объединения баз данных дополнительно включает операцию формирования объединенной базы данных, которая объединяет характеристики пациентов в обезличенных базах (X, Y) данных здравоохранения для каждого сопоставленного пациента в единую запись пациента.
5. Устройство по любому из пп. 1–4, в котором расчет статистических распределений характеристик для набора характеристик пациентов по всем пациентам, относящимся к заполнителю для медицинского учреждения, включает аппроксимацию статистических распределений характеристик с получением параметризованных моделей.
6. Устройство по любому из пп. 1–5, в котором:
расчет статистических распределений характеристик включает вычисление статистических распределений характеристик за год; а
сопоставление заполнителей для медицинских учреждений включает сопоставление заполнителей для медицинских учреждений в одной обезличенной базе (X) данных здравоохранения с заполнителями для медицинских учреждений в другой обезличенной базе (Y) данных здравоохранения путем сопоставления соответствующих годовых статистических распределений характеристик.
7. Устройство по п. 6, в котором сопоставление заполнителей для медицинских учреждений включает:
расчет значения вероятности (p-значения) в предположении, что каждые два соответствующие годовые распределения характеристик принадлежат одному и тому же распределению; и
сопоставление заполнителей для медицинского учреждения в одной обезличенной базе (X) данных здравоохранения с заполнителями для другой обезличенной базы (Y) данных здравоохранения, если p-значения превышают порог для порогового значения лет.
8. Устройство по п. 7, в котором p-значение рассчитано с использованием критерия Колмогорова-Смирнова или критерия хи-квадрат.
9. Устройство по любому из пп.1–8, в котором процесс объединения баз данных дополнительно включает операцию выбора набора характеристик пациентов как подмножества набора характеристик пациентов, содержащихся в каждой одной из двух или более обезличенных баз (X, Y) данных здравоохранения, для которых оценочная статистическая точность характеристики пациента в каждой одной из двух или более обезличенных баз данных здравоохранения превышает пороговое значение.
10. Устройство по любому из пп. 1–9, в котором процесс объединения баз данных действует на двух или более обезличенных базах (X, Y) данных здравоохранения, но не задействует базовые необезличенные данные пациентов, из которых при помощи обезличивания были сформированы две или более обезличенных баз (X, Y) данных здравоохранения.
11. Некратковременный носитель для хранения, хранящий инструкции, исполняемые электронным устройством (10) обработки данных для выполнения процесса (20) объединения баз данных, объединяющего две или более обезличенные базы (X,Y) данных здравоохранения, каждая из которых содержит персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинских учреждений, и выполненного с возможностью:
в процессе обработки медицинских данных осуществлять поиск содержимого одной или обеих баз данных (X, Y) и установление корреляций данных баз данных различных заполнителей, удовлетворяющих некоторому критерию запроса,
при обработке результатов поиска совмещать или комбинировать данные сопоставленных пациентов из двух баз (X, Y) данных, причем
если обе записи сопоставленных пациентов в соответствующих базах (X, Y) хранят одно и то же значение для характеристики пациентов, то извлеченное значение для этой характеристики будет этим общим значением,
в процессе объединения формировать таблицу совмещения баз данных или объединенную базу данных, используя только информацию, содержащуюся в обезличенных базах (X, Y) данных, которые содержат единую запись пациента для каждой сопоставленной пары пациентов в двух базах (X, Y) данных, таким образом, что сформированная объединенная обезличенная база данных здравоохранения объединяет характеристики пациентов в обезличенных базах (X, Y) данных здравоохранения для каждого сопоставленного пациента в единую запись пациента,
осуществлять контроль собранной и хранящейся информации в обезличенных базах (X, Y) данных по каждому заполнителю - медицинскому учреждению, для идентификации медицинского учреждения и соответствующих данных по этому медицинскому учреждению.
12. Некратковременный носитель для хранения по п. 11, в котором расчет статистических распределений характеристик пациентов включает формирование гистограмм статистического распределения характеристик пациентов и аппроксимацию этих гистограмм с получением параметризованных моделей.
13. Некратковременный носитель для хранения по любому из пп. 11, 12, в котором:
статистические распределения характеристик пациентов рассчитаны для заданных интервалов времени, а
сопоставление заполнителей для медицинских учреждений выполнено путем сопоставления статистических распределений характеристик пациентов на общих интервалах времени, для которых обе базы (X, Y) данных содержат данные пациентов для соответствующих заполнителей для медицинских учреждений.
14. Некратковременный носитель для хранения по п. 13, в котором заданные интервалы времени являются годовыми интервалами времени.
15. Некратковременный носитель для хранения по любому из пп. 13, 14, в котором сопоставление заполнителей для медицинских учреждений включает:
расчет значений вероятности (p-значений) в предположении, что статистические распределения характеристик пациентов, рассчитанные для каждого общего интервала времени, принадлежат одному и тому же распределению; и
сопоставление заполнителей для медицинских учреждений с использованием меры подобия, рассчитанной путем агрегирования p-значений, рассчитанных для общих интервалов времени.
16. Некратковременный носитель для хранения по п. 15, в котором p-значение рассчитано с использованием критерия Колмогорова-Смирнова или критерия хи-квадрат.
17. Некратковременный носитель для хранения по любому из пп. 11-16, в котором процесс объединения баз данных дополнительно включает:
оценку статистической точности характеристик пациентов, которые являются общими для двух или более обезличенных баз (X, Y) данных здравоохранения; и
выбор набора характеристик пациентов, для которых статистические распределения характеристик пациентов рассчитаны путем выбора характеристик пациентов, имеющих высокую оценочную статистическую точность, в каждой одной из двух или более обезличенных баз (X, Y) данных здравоохранения.
18. Некратковременный носитель для хранения по любому из пп. 11-17, в котором процесс объединения баз данных действует на двух или более обезличенных базах (X, Y) данных, но не задействует базовые необезличенные данные пациентов, из которых при помощи обезличивания были сформированы две или более обезличенных баз (X, Y) данных здравоохранения.
19. Способ объединения баз данных, который объединяет две или более обезличенных баз (X, Y) данных здравоохранения, каждая из которых содержит персональные данные, обезличенные в том числе путем замены медицинских учреждений заполнителями для медицинского учреждения,
причем способ объединения баз данных включает:
обработку медицинских данных путем осуществления поиска содержимого одной или обеих баз данных (X, Y) и установление корреляций данных баз данных различных заполнителей, удовлетворяющих некоторому критерию запроса,
при обработке результатов поиска совмещение или комбинирование данных сопоставленных пациентов из двух баз (X, Y) данных, причем
если обе записи сопоставленных пациентов в соответствующих базах (X, Y) хранят одно и то же значение для характеристики пациентов, то извлеченное значение для этой характеристики будет этим общим значением,
в процессе объединения формирование таблицы совмещения баз данных или объединенной базы данных, используя только информацию, содержащуюся в обезличенных базах (X, Y) данных, которые содержат единую запись пациента для каждой сопоставленной пары пациентов в двух базах (X, Y) данных, таким образом, что сформированная объединенная обезличенная база данных здравоохранения объединяет характеристики пациентов в обезличенных базах (X, Y) данных здравоохранения для каждого сопоставленного пациента в единую запись пациента,
осуществление контроля собранной и хранящейся информации в обезличенных базах (X, Y) данных по каждому заполнителю - медицинскому учреждению, для идентификации медицинского учреждения и соответствующих данных по этому медицинскому учреждению.
20. Способ объединения баз данных по п. 19, дополнительно включающий:
оценку статистической точности характеристик пациентов, которые являются общими для двух или более обезличенных баз (X, Y) данных здравоохранения; и
выбор набора характеристик пациентов, для которых статистические распределения характеристик пациентов рассчитаны путем выбора характеристик пациентов с высокой оценочной статистической точностью в каждой одной из двух или более обезличенных баз (X, Y) данных здравоохранения.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562248542P | 2015-10-30 | 2015-10-30 | |
US62/248,542 | 2015-10-30 | ||
PCT/IB2016/056201 WO2017072623A1 (en) | 2015-10-30 | 2016-10-17 | Hospital matching of de-identified healthcare databases without obvious quasi-identifiers |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018119771A RU2018119771A (ru) | 2019-12-02 |
RU2018119771A3 RU2018119771A3 (ru) | 2020-02-17 |
RU2729458C2 true RU2729458C2 (ru) | 2020-08-06 |
Family
ID=57227010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018119771A RU2729458C2 (ru) | 2015-10-30 | 2016-10-17 | Сопоставление больниц из обезличенных баз данных здравоохранения без очевидных квазиидентификаторов |
Country Status (5)
Country | Link |
---|---|
US (1) | US10818383B2 (ru) |
EP (1) | EP3369018A1 (ru) |
CN (1) | CN108352196A (ru) |
RU (1) | RU2729458C2 (ru) |
WO (1) | WO2017072623A1 (ru) |
Families Citing this family (131)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007300057A1 (en) | 2006-09-26 | 2008-04-03 | W. Randal Clegg | Individual health record system and apparatus |
US11170879B1 (en) | 2006-09-26 | 2021-11-09 | Centrifyhealth, Llc | Individual health record system and apparatus |
US11871901B2 (en) | 2012-05-20 | 2024-01-16 | Cilag Gmbh International | Method for situational awareness for surgical network or surgical network connected device capable of adjusting function based on a sensed situation or usage |
US11504192B2 (en) | 2014-10-30 | 2022-11-22 | Cilag Gmbh International | Method of hub communication with surgical instrument systems |
US10531286B2 (en) * | 2016-10-24 | 2020-01-07 | Facebook, Inc. | Methods and systems for auto-completion of anonymized strings |
US10824738B2 (en) * | 2017-09-18 | 2020-11-03 | Healthverity, Inc. | Privacy-preserving analysis system for secure multiparty computing |
US11045197B2 (en) | 2017-10-30 | 2021-06-29 | Cilag Gmbh International | Clip applier comprising a movable clip magazine |
US11311342B2 (en) | 2017-10-30 | 2022-04-26 | Cilag Gmbh International | Method for communicating with surgical instrument systems |
US11291510B2 (en) | 2017-10-30 | 2022-04-05 | Cilag Gmbh International | Method of hub communication with surgical instrument systems |
US11911045B2 (en) | 2017-10-30 | 2024-02-27 | Cllag GmbH International | Method for operating a powered articulating multi-clip applier |
US11801098B2 (en) | 2017-10-30 | 2023-10-31 | Cilag Gmbh International | Method of hub communication with surgical instrument systems |
US11510741B2 (en) | 2017-10-30 | 2022-11-29 | Cilag Gmbh International | Method for producing a surgical instrument comprising a smart electrical system |
US11564756B2 (en) | 2017-10-30 | 2023-01-31 | Cilag Gmbh International | Method of hub communication with surgical instrument systems |
US11229436B2 (en) | 2017-10-30 | 2022-01-25 | Cilag Gmbh International | Surgical system comprising a surgical tool and a surgical hub |
US20190125320A1 (en) | 2017-10-30 | 2019-05-02 | Ethicon Llc | Control system arrangements for a modular surgical instrument |
US11317919B2 (en) | 2017-10-30 | 2022-05-03 | Cilag Gmbh International | Clip applier comprising a clip crimping system |
US10595887B2 (en) | 2017-12-28 | 2020-03-24 | Ethicon Llc | Systems for adjusting end effector parameters based on perioperative information |
US11432885B2 (en) | 2017-12-28 | 2022-09-06 | Cilag Gmbh International | Sensing arrangements for robot-assisted surgical platforms |
US20190201113A1 (en) | 2017-12-28 | 2019-07-04 | Ethicon Llc | Controls for robot-assisted surgical platforms |
US11589888B2 (en) | 2017-12-28 | 2023-02-28 | Cilag Gmbh International | Method for controlling smart energy devices |
US11304699B2 (en) | 2017-12-28 | 2022-04-19 | Cilag Gmbh International | Method for adaptive control schemes for surgical network control and interaction |
US11132462B2 (en) | 2017-12-28 | 2021-09-28 | Cilag Gmbh International | Data stripping method to interrogate patient records and create anonymized record |
US11308075B2 (en) | 2017-12-28 | 2022-04-19 | Cilag Gmbh International | Surgical network, instrument, and cloud responses based on validation of received dataset and authentication of its source and integrity |
US11666331B2 (en) | 2017-12-28 | 2023-06-06 | Cilag Gmbh International | Systems for detecting proximity of surgical end effector to cancerous tissue |
US11424027B2 (en) | 2017-12-28 | 2022-08-23 | Cilag Gmbh International | Method for operating surgical instrument systems |
US10695081B2 (en) | 2017-12-28 | 2020-06-30 | Ethicon Llc | Controlling a surgical instrument according to sensed closure parameters |
US11160605B2 (en) | 2017-12-28 | 2021-11-02 | Cilag Gmbh International | Surgical evacuation sensing and motor control |
US11179208B2 (en) | 2017-12-28 | 2021-11-23 | Cilag Gmbh International | Cloud-based medical analytics for security and authentication trends and reactive measures |
US10966791B2 (en) | 2017-12-28 | 2021-04-06 | Ethicon Llc | Cloud-based medical analytics for medical facility segmented individualization of instrument function |
US10987178B2 (en) | 2017-12-28 | 2021-04-27 | Ethicon Llc | Surgical hub control arrangements |
US10943454B2 (en) | 2017-12-28 | 2021-03-09 | Ethicon Llc | Detection and escalation of security responses of surgical instruments to increasing severity threats |
US11633237B2 (en) | 2017-12-28 | 2023-04-25 | Cilag Gmbh International | Usage and technique analysis of surgeon / staff performance against a baseline to optimize device utilization and performance for both current and future procedures |
US10944728B2 (en) | 2017-12-28 | 2021-03-09 | Ethicon Llc | Interactive surgical systems with encrypted communication capabilities |
US10932872B2 (en) | 2017-12-28 | 2021-03-02 | Ethicon Llc | Cloud-based medical analytics for linking of local usage trends with the resource acquisition behaviors of larger data set |
US11678881B2 (en) | 2017-12-28 | 2023-06-20 | Cilag Gmbh International | Spatial awareness of surgical hubs in operating rooms |
US11324557B2 (en) | 2017-12-28 | 2022-05-10 | Cilag Gmbh International | Surgical instrument with a sensing array |
US11786245B2 (en) | 2017-12-28 | 2023-10-17 | Cilag Gmbh International | Surgical systems with prioritized data transmission capabilities |
US20190201118A1 (en) | 2017-12-28 | 2019-07-04 | Ethicon Llc | Display arrangements for robot-assisted surgical platforms |
US11056244B2 (en) | 2017-12-28 | 2021-07-06 | Cilag Gmbh International | Automated data scaling, alignment, and organizing based on predefined parameters within surgical networks |
US11304763B2 (en) | 2017-12-28 | 2022-04-19 | Cilag Gmbh International | Image capturing of the areas outside the abdomen to improve placement and control of a surgical device in use |
US11576677B2 (en) | 2017-12-28 | 2023-02-14 | Cilag Gmbh International | Method of hub communication, processing, display, and cloud analytics |
US11612408B2 (en) | 2017-12-28 | 2023-03-28 | Cilag Gmbh International | Determining tissue composition via an ultrasonic system |
US10898622B2 (en) | 2017-12-28 | 2021-01-26 | Ethicon Llc | Surgical evacuation system with a communication circuit for communication between a filter and a smoke evacuation device |
US11419667B2 (en) | 2017-12-28 | 2022-08-23 | Cilag Gmbh International | Ultrasonic energy device which varies pressure applied by clamp arm to provide threshold control pressure at a cut progression location |
US11423007B2 (en) | 2017-12-28 | 2022-08-23 | Cilag Gmbh International | Adjustment of device control programs based on stratified contextual data in addition to the data |
US11419630B2 (en) | 2017-12-28 | 2022-08-23 | Cilag Gmbh International | Surgical system distributed processing |
US10849697B2 (en) | 2017-12-28 | 2020-12-01 | Ethicon Llc | Cloud interface for coupled surgical devices |
US11571234B2 (en) | 2017-12-28 | 2023-02-07 | Cilag Gmbh International | Temperature control of ultrasonic end effector and control system therefor |
US10758310B2 (en) | 2017-12-28 | 2020-09-01 | Ethicon Llc | Wireless pairing of a surgical device with another device within a sterile surgical field based on the usage and situational awareness of devices |
US11266468B2 (en) | 2017-12-28 | 2022-03-08 | Cilag Gmbh International | Cooperative utilization of data derived from secondary sources by intelligent surgical hubs |
US11100631B2 (en) | 2017-12-28 | 2021-08-24 | Cilag Gmbh International | Use of laser light and red-green-blue coloration to determine properties of back scattered light |
US11364075B2 (en) | 2017-12-28 | 2022-06-21 | Cilag Gmbh International | Radio frequency energy device for delivering combined electrical signals |
US11109866B2 (en) | 2017-12-28 | 2021-09-07 | Cilag Gmbh International | Method for circular stapler control algorithm adjustment based on situational awareness |
US11202570B2 (en) | 2017-12-28 | 2021-12-21 | Cilag Gmbh International | Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems |
US11857152B2 (en) | 2017-12-28 | 2024-01-02 | Cilag Gmbh International | Surgical hub spatial awareness to determine devices in operating theater |
US11937769B2 (en) | 2017-12-28 | 2024-03-26 | Cilag Gmbh International | Method of hub communication, processing, storage and display |
US11903601B2 (en) | 2017-12-28 | 2024-02-20 | Cilag Gmbh International | Surgical instrument comprising a plurality of drive systems |
US11969142B2 (en) | 2017-12-28 | 2024-04-30 | Cilag Gmbh International | Method of compressing tissue within a stapling device and simultaneously displaying the location of the tissue within the jaws |
US11166772B2 (en) | 2017-12-28 | 2021-11-09 | Cilag Gmbh International | Surgical hub coordination of control and communication of operating room devices |
US11257589B2 (en) | 2017-12-28 | 2022-02-22 | Cilag Gmbh International | Real-time analysis of comprehensive cost of all instrumentation used in surgery utilizing data fluidity to track instruments through stocking and in-house processes |
US11304720B2 (en) | 2017-12-28 | 2022-04-19 | Cilag Gmbh International | Activation of energy devices |
US11844579B2 (en) | 2017-12-28 | 2023-12-19 | Cilag Gmbh International | Adjustments based on airborne particle properties |
US11786251B2 (en) | 2017-12-28 | 2023-10-17 | Cilag Gmbh International | Method for adaptive control schemes for surgical network control and interaction |
US11304745B2 (en) | 2017-12-28 | 2022-04-19 | Cilag Gmbh International | Surgical evacuation sensing and display |
US11540855B2 (en) | 2017-12-28 | 2023-01-03 | Cilag Gmbh International | Controlling activation of an ultrasonic surgical instrument according to the presence of tissue |
US11771487B2 (en) | 2017-12-28 | 2023-10-03 | Cilag Gmbh International | Mechanisms for controlling different electromechanical systems of an electrosurgical instrument |
US11317937B2 (en) | 2018-03-08 | 2022-05-03 | Cilag Gmbh International | Determining the state of an ultrasonic end effector |
US20190206555A1 (en) * | 2017-12-28 | 2019-07-04 | Ethicon Llc | Cloud-based medical analytics for customization and recommendations to a user |
US11234756B2 (en) | 2017-12-28 | 2022-02-01 | Cilag Gmbh International | Powered surgical tool with predefined adjustable control algorithm for controlling end effector parameter |
US11147607B2 (en) | 2017-12-28 | 2021-10-19 | Cilag Gmbh International | Bipolar combination device that automatically adjusts pressure based on energy modality |
US11376002B2 (en) | 2017-12-28 | 2022-07-05 | Cilag Gmbh International | Surgical instrument cartridge sensor assemblies |
US11311306B2 (en) | 2017-12-28 | 2022-04-26 | Cilag Gmbh International | Surgical systems for detecting end effector tissue distribution irregularities |
US11069012B2 (en) | 2017-12-28 | 2021-07-20 | Cilag Gmbh International | Interactive surgical systems with condition handling of devices and data capabilities |
US11559307B2 (en) | 2017-12-28 | 2023-01-24 | Cilag Gmbh International | Method of robotic hub communication, detection, and control |
US11278281B2 (en) | 2017-12-28 | 2022-03-22 | Cilag Gmbh International | Interactive surgical system |
US11529187B2 (en) | 2017-12-28 | 2022-12-20 | Cilag Gmbh International | Surgical evacuation sensor arrangements |
US11284936B2 (en) | 2017-12-28 | 2022-03-29 | Cilag Gmbh International | Surgical instrument having a flexible electrode |
US11864728B2 (en) | 2017-12-28 | 2024-01-09 | Cilag Gmbh International | Characterization of tissue irregularities through the use of mono-chromatic light refractivity |
US11659023B2 (en) | 2017-12-28 | 2023-05-23 | Cilag Gmbh International | Method of hub communication |
US11389164B2 (en) | 2017-12-28 | 2022-07-19 | Cilag Gmbh International | Method of using reinforced flexible circuits with multiple sensors to optimize performance of radio frequency devices |
US11896322B2 (en) | 2017-12-28 | 2024-02-13 | Cilag Gmbh International | Sensing the patient position and contact utilizing the mono-polar return pad electrode to provide situational awareness to the hub |
US11076921B2 (en) | 2017-12-28 | 2021-08-03 | Cilag Gmbh International | Adaptive control program updates for surgical hubs |
US20190201087A1 (en) | 2017-12-28 | 2019-07-04 | Ethicon Llc | Smoke evacuation system including a segmented control circuit for interactive surgical platform |
US11832840B2 (en) | 2017-12-28 | 2023-12-05 | Cilag Gmbh International | Surgical instrument having a flexible circuit |
US11291495B2 (en) | 2017-12-28 | 2022-04-05 | Cilag Gmbh International | Interruption of energy due to inadvertent capacitive coupling |
US11446052B2 (en) | 2017-12-28 | 2022-09-20 | Cilag Gmbh International | Variation of radio frequency and ultrasonic power level in cooperation with varying clamp arm pressure to achieve predefined heat flux or power applied to tissue |
US11051876B2 (en) | 2017-12-28 | 2021-07-06 | Cilag Gmbh International | Surgical evacuation flow paths |
US11818052B2 (en) | 2017-12-28 | 2023-11-14 | Cilag Gmbh International | Surgical network determination of prioritization of communication, interaction, or processing based on system or device needs |
US11672605B2 (en) | 2017-12-28 | 2023-06-13 | Cilag Gmbh International | Sterile field interactive control displays |
US10892899B2 (en) | 2017-12-28 | 2021-01-12 | Ethicon Llc | Self describing data packets generated at an issuing instrument |
US11969216B2 (en) | 2017-12-28 | 2024-04-30 | Cilag Gmbh International | Surgical network recommendations from real time analysis of procedure variables against a baseline highlighting differences from the optimal solution |
US11602393B2 (en) | 2017-12-28 | 2023-03-14 | Cilag Gmbh International | Surgical evacuation sensing and generator control |
US11464535B2 (en) | 2017-12-28 | 2022-10-11 | Cilag Gmbh International | Detection of end effector emersion in liquid |
US11410259B2 (en) | 2017-12-28 | 2022-08-09 | Cilag Gmbh International | Adaptive control program updates for surgical devices |
US11559308B2 (en) | 2017-12-28 | 2023-01-24 | Cilag Gmbh International | Method for smart energy device infrastructure |
US11896443B2 (en) | 2017-12-28 | 2024-02-13 | Cilag Gmbh International | Control of a surgical system through a surgical barrier |
US11096693B2 (en) | 2017-12-28 | 2021-08-24 | Cilag Gmbh International | Adjustment of staple height of at least one row of staples based on the sensed tissue thickness or force in closing |
US11744604B2 (en) | 2017-12-28 | 2023-09-05 | Cilag Gmbh International | Surgical instrument with a hardware-only control circuit |
US11832899B2 (en) | 2017-12-28 | 2023-12-05 | Cilag Gmbh International | Surgical systems with autonomously adjustable control programs |
US11464559B2 (en) | 2017-12-28 | 2022-10-11 | Cilag Gmbh International | Estimating state of ultrasonic end effector and control system therefor |
US11253315B2 (en) | 2017-12-28 | 2022-02-22 | Cilag Gmbh International | Increasing radio frequency to create pad-less monopolar loop |
US11273001B2 (en) | 2017-12-28 | 2022-03-15 | Cilag Gmbh International | Surgical hub and modular device response adjustment based on situational awareness |
US10892995B2 (en) | 2017-12-28 | 2021-01-12 | Ethicon Llc | Surgical network determination of prioritization of communication, interaction, or processing based on system or device needs |
US11701162B2 (en) | 2018-03-08 | 2023-07-18 | Cilag Gmbh International | Smart blade application for reusable and disposable devices |
US11844545B2 (en) | 2018-03-08 | 2023-12-19 | Cilag Gmbh International | Calcified vessel identification |
US11259830B2 (en) | 2018-03-08 | 2022-03-01 | Cilag Gmbh International | Methods for controlling temperature in ultrasonic device |
US11207067B2 (en) | 2018-03-28 | 2021-12-28 | Cilag Gmbh International | Surgical stapling device with separate rotary driven closure and firing systems and firing member that engages both jaws while firing |
US11589865B2 (en) | 2018-03-28 | 2023-02-28 | Cilag Gmbh International | Methods for controlling a powered surgical stapler that has separate rotary closure and firing systems |
US11129611B2 (en) | 2018-03-28 | 2021-09-28 | Cilag Gmbh International | Surgical staplers with arrangements for maintaining a firing member thereof in a locked configuration unless a compatible cartridge has been installed therein |
US10973520B2 (en) | 2018-03-28 | 2021-04-13 | Ethicon Llc | Surgical staple cartridge with firing member driven camming assembly that has an onboard tissue cutting feature |
US11219453B2 (en) | 2018-03-28 | 2022-01-11 | Cilag Gmbh International | Surgical stapling devices with cartridge compatible closure and firing lockout arrangements |
US11278280B2 (en) | 2018-03-28 | 2022-03-22 | Cilag Gmbh International | Surgical instrument comprising a jaw closure lockout |
US11090047B2 (en) | 2018-03-28 | 2021-08-17 | Cilag Gmbh International | Surgical instrument comprising an adaptive control system |
US11096688B2 (en) | 2018-03-28 | 2021-08-24 | Cilag Gmbh International | Rotary driven firing members with different anvil and channel engagement features |
US11471156B2 (en) | 2018-03-28 | 2022-10-18 | Cilag Gmbh International | Surgical stapling devices with improved rotary driven closure systems |
CN111192689B (zh) * | 2018-11-15 | 2023-11-24 | 零氪科技(北京)有限公司 | 一种基于医疗数据的患者识别方法 |
US11132386B2 (en) | 2019-02-15 | 2021-09-28 | International Business Machines Corporation | Fast linking of anonymized datasets |
US11317915B2 (en) | 2019-02-19 | 2022-05-03 | Cilag Gmbh International | Universal cartridge based key feature that unlocks multiple lockout arrangements in different surgical staplers |
US11386983B2 (en) | 2019-02-19 | 2022-07-12 | International Business Machines Corporation | Preserving privacy for data analysis |
US11751872B2 (en) | 2019-02-19 | 2023-09-12 | Cilag Gmbh International | Insertable deactivator element for surgical stapler lockouts |
US11357503B2 (en) | 2019-02-19 | 2022-06-14 | Cilag Gmbh International | Staple cartridge retainers with frangible retention features and methods of using same |
US11369377B2 (en) | 2019-02-19 | 2022-06-28 | Cilag Gmbh International | Surgical stapling assembly with cartridge based retainer configured to unlock a firing lockout |
US11331101B2 (en) | 2019-02-19 | 2022-05-17 | Cilag Gmbh International | Deactivator element for defeating surgical stapling device lockouts |
US11593353B2 (en) | 2019-04-03 | 2023-02-28 | Unitedhealth Group Incorporated | Managing data objects for graph-based data structures |
CN110177075B (zh) * | 2019-04-15 | 2023-08-22 | 深圳壹账通智能科技有限公司 | 异常访问拦截方法、装置、计算机设备及存储介质 |
WO2020235018A1 (ja) * | 2019-05-21 | 2020-11-26 | 日本電信電話株式会社 | 情報処理システム、情報処理装置、情報処理方法及びプログラム |
USD950728S1 (en) | 2019-06-25 | 2022-05-03 | Cilag Gmbh International | Surgical staple cartridge |
USD952144S1 (en) | 2019-06-25 | 2022-05-17 | Cilag Gmbh International | Surgical staple cartridge retainer with firing system authentication key |
USD964564S1 (en) | 2019-06-25 | 2022-09-20 | Cilag Gmbh International | Surgical staple cartridge retainer with a closure system authentication key |
WO2021097309A1 (en) * | 2019-11-14 | 2021-05-20 | Rhodes Group, Inc. | System and method for translating medical laboratory data into actionable information |
WO2023070284A1 (zh) * | 2021-10-25 | 2023-05-04 | 武汉联影医疗科技有限公司 | 匿名化处理方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020073138A1 (en) * | 2000-12-08 | 2002-06-13 | Gilbert Eric S. | De-identification and linkage of data records |
US20080195600A1 (en) * | 2006-05-25 | 2008-08-14 | Deakter Daniel R | Efficient method and process to search structured and unstructured patient data to match patients to clinical drug/device trials |
US20090177637A1 (en) * | 2003-06-04 | 2009-07-09 | The Trustees Of The University Of Pennsylvania | Ndma db schema, dicom to relational schema translation, and xml to sql query translation |
RU2531572C2 (ru) * | 2008-12-22 | 2014-10-20 | РОКСТАР КОНСОРЦИУМ ЮЭс ЛП | Способ репликации баз данных и устройство обновления таблицы |
US20150149208A1 (en) * | 2013-11-27 | 2015-05-28 | Accenture Global Services Limited | System for anonymizing and aggregating protected health information |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10096075B2 (en) * | 2008-09-12 | 2018-10-09 | Epic Systems Corporation | Patient community system with anonymized electronic medical data |
US20130304506A1 (en) * | 2012-05-08 | 2013-11-14 | Healthenic Inc. | System and method for managing health risks |
US20140379373A1 (en) * | 2013-06-19 | 2014-12-25 | Javier Vinals | Management of Medical Information |
US10803538B2 (en) * | 2014-04-14 | 2020-10-13 | Optum, Inc. | System and method for automated data entry and workflow management |
EP3262547A1 (en) | 2015-02-27 | 2018-01-03 | Koninklijke Philips N.V. | Efficient integration of de-identified records |
-
2016
- 2016-10-17 WO PCT/IB2016/056201 patent/WO2017072623A1/en active Application Filing
- 2016-10-17 US US15/771,726 patent/US10818383B2/en active Active
- 2016-10-17 EP EP16790709.6A patent/EP3369018A1/en not_active Withdrawn
- 2016-10-17 CN CN201680062766.XA patent/CN108352196A/zh active Pending
- 2016-10-17 RU RU2018119771A patent/RU2729458C2/ru not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020073138A1 (en) * | 2000-12-08 | 2002-06-13 | Gilbert Eric S. | De-identification and linkage of data records |
US20090177637A1 (en) * | 2003-06-04 | 2009-07-09 | The Trustees Of The University Of Pennsylvania | Ndma db schema, dicom to relational schema translation, and xml to sql query translation |
US20080195600A1 (en) * | 2006-05-25 | 2008-08-14 | Deakter Daniel R | Efficient method and process to search structured and unstructured patient data to match patients to clinical drug/device trials |
RU2531572C2 (ru) * | 2008-12-22 | 2014-10-20 | РОКСТАР КОНСОРЦИУМ ЮЭс ЛП | Способ репликации баз данных и устройство обновления таблицы |
US20150149208A1 (en) * | 2013-11-27 | 2015-05-28 | Accenture Global Services Limited | System for anonymizing and aggregating protected health information |
Also Published As
Publication number | Publication date |
---|---|
EP3369018A1 (en) | 2018-09-05 |
US10818383B2 (en) | 2020-10-27 |
RU2018119771A (ru) | 2019-12-02 |
WO2017072623A1 (en) | 2017-05-04 |
CN108352196A (zh) | 2018-07-31 |
US20180358112A1 (en) | 2018-12-13 |
RU2018119771A3 (ru) | 2020-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2729458C2 (ru) | Сопоставление больниц из обезличенных баз данных здравоохранения без очевидных квазиидентификаторов | |
CN111863267B (zh) | 数据信息获取方法、数据分析方法、装置以及存储介质 | |
US10685138B2 (en) | Re-identification risk measurement estimation of a dataset | |
JP6956107B2 (ja) | 明確な照合情報を持たない識別不能のヘルスケアデータベースの病院マッチング | |
US11664098B2 (en) | Determining journalist risk of a dataset using population equivalence class distribution estimation | |
US20180012039A1 (en) | Anonymization processing device, anonymization processing method, and program | |
CA2913647C (en) | Method of re-identification risk measurement and suppression on a longitudinal dataset | |
US20170161519A1 (en) | Information processing device, information processing method and recording medium | |
US10776516B2 (en) | Electronic medical record datasifter | |
EP3779757B1 (en) | Simulated risk contributions | |
CN110752027B (zh) | 电子病历数据推送方法、装置、计算机设备和存储介质 | |
US20210202111A1 (en) | Method of classifying medical records | |
CN109522331B (zh) | 以个人为中心的区域化多维度健康数据处理方法及介质 | |
Batra et al. | Mining standardized semantic interoperable electronic healthcare records | |
Yee et al. | Big data: Its implications on healthcare and future steps | |
EP3654339A1 (en) | Method of classifying medical records | |
US20240070323A1 (en) | Method and system for modelling re-identification attacker's contextualized background knowledge | |
Joffe et al. | Optimized dual threshold entity resolution for electronic health record databases–training set size and active learning | |
Anandi et al. | Descriptive and Predictive Analytics on Electronic Health Records using Machine Learning | |
EP2685407A1 (en) | Computer system, method and program to quantify quality of service provision | |
SANDHYA et al. | CLINICAL DECISION SUPPORT SYSTEM ON COPD PREDICTION USING BIG DATA ANALYTICS WITH IMPROVED PATIENT MATCHING | |
Pinto | Analysis of Usage Patterns of Medical Image Exams in Medical Environments | |
WO2023081912A1 (en) | Systems and methods for indexing and searching health data | |
JP2022115284A (ja) | 匿名加工システム、匿名加工プログラム及び匿名加工方法 | |
Deepthi et al. | Trends in Mining Biological Big Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20201018 |