WO2022112624A1

WO2022112624A1 - Sistema y método de gestión para una arquitectura de base de datos multimodelo distribuida

Info

Publication number: WO2022112624A1
Application number: PCT/ES2021/070271
Authority: WO
Inventors: Hugo HERRERO ANTÓN DE VEZ; Ferran GARCÍA CASADO
Original assignee: Alma It Systems, S.L.
Priority date: 2020-11-27
Filing date: 2021-04-23
Publication date: 2022-06-02
Also published as: EP4254219A1; US20230418839A1; CN116917881A

Abstract

La presente invención se refiere a una arquitectura de base de datos multimodelo distribuida, en donde la arquitectura de base de datos comprende una pluralidad de microservicios de usuario configurados para crear, almacenar y gestionar bases de datos de grafos con datos sensibles de bases de datos convencionales prexistentes, un sistema de gestión para arquitectura de base de datos multimodelo distribuida, en donde el sistema de gestión comprende una interfaz de usuario, una pluralidad de microservicios de perfil, una base de datos clave-valor y un software intermedio, y un método para gestionar una arquitectura de base de datos multimodelo distribuida.

Description

DESCRIPCIÓN

Sistema y método de gestión para una arquitectura de base de datos multimodelo distribuida

Objeto de la invención

Antecedentes de la invención

Hoy en día, el análisis, procesamiento y aprovechamiento de los datos es un campo técnico floreciente con perspectivas de crecimiento enormes en los próximos años, como lo sugiere el éxito de las compañías líderes en el campo. Aunque se han dirigido muchos esfuerzos a analizar hábitos de consumo, otras aplicaciones potenciales han atraído menos atención; este es el caso, por ejemplo, de los datos médicos. Cada paciente tiene un registro de por vida de diagnósticos, tratamientos, pruebas clínicas y otros datos valiosos y sensibles que se almacenan por las instituciones médicas o los mismos pacientes durante décadas. Al ser un almacenamiento de información a muy largo plazo, estos registros comprenden diferentes formatos, que varían de copias físicas impresas con notas manuscritas de médicos hasta los últimos formatos digitales.

Adicionalmente, los registros normalmente están dispersos en diferentes almacenamientos que pertenecen a varios hospitales, en ocasiones que pertenecen a diferentes jurisdicciones. Incluso en un mismo hospital se almacenan diferentes tipos de datos en diferentes servidores que están diseñados bajo diferentes estándares médicos y así cada uno de estos servidores tiene su propia arquitectura de datos y protocolos de comunicación (DICOM, LOINC, RxNORM, SNOMED CT, etc.); además, cada uno de esos sistemas es desarrollado y mantenido por diferentes proveedores, lo que le da más variabilidad y complejidad a la integración de datos. Esta fragmentación de los datos a menudo es un obstáculo grave para la recopilación, actualización o investigación de estos registros, ya sea que se consideren como un único paciente o como un colectivo. Esta integración de datos o uniones de datos, generalmente ocurren a nivel de aplicación, lo que hace que la administración de datos sea compleja, ineficiente y muy costosa, debido a la necesidad de configurar cachés, lagos de datos intermedios y escalar bases de datos y servidores de procesamiento para realizar las agregaciones y traducciones de datos.

Debe considerarse que los datos cuantitativos proporcionados por pruebas complementarias (como radiología o análisis de laboratorio) son mucho más valiosos si están relacionados con el resto de los datos de registro clínico del paciente; de hecho, el valor de los datos es proporcional al número de relaciones significativas que puedan establecerse. Por lo tanto, es deseable tener una base de datos que permita una búsqueda y actualización sencilla de las relaciones entre las diferentes variables incluidas en el registro del paciente.

Típicamente, la mayoría de las bases de datos (BD) están estructuradas como bases de datos relaciónales (BDR); estas bases de datos relaciónales se vuelven especialmente complejas y rígidas cuando se trata de expresar relaciones entre elementos de datos, especialmente en el caso de relaciones complejas, por ejemplo, cuando es necesario obtener información de dos o más tablas relacionadas de la base de datos ( uniones de múltiples niveles ); por otro lado, estas uniones de múltiples niveles son difíciles de escalar horizontalmente. Las uniones pueden calcular eficazmente estadísticas de tablas de bases de datos existentes, pero la unión de múltiples niveles también es demasiado compleja para conjuntos de datos grandes. Si es necesario analizar una gran cantidad de datos, sería necesario enumerar todas las tupias de entidades relacionadas: "el coste del enfoque de enumeración está cerca de la materialización del producto cartesiano de los conjuntos de entidades, que crece exponencialmente con el número de conjuntos de entidades implicadas (Oliver y Zhensong, 2015; Das et al., 2015), (Vicknair et al., 2010; Partner et al., 2014)".

Un posible enfoque sería estructurar datos de paciente en bases de datos de grafos (BDG). Tales BDG pueden manejar la complejidad real de las dependencias entre datos. Además, la mayoría de los algoritmos de aprendizaje de máquina (ML) funcionan mucho mejor con implementaciones vectorizadas, tales como aquellas de las bases de datos de grafos, y esa implementación hace mucho más fácil el uso de bibliotecas para procesar datos en paralelo; puesto que las BDG normalmente se representan usando una matriz de afinidad, comparten la misma estructura con aplicaciones vectorizadas de aprendizaje de máquina. Además, las funciones en un grafo pueden representarse como un vector, que conlleva otra ventaja: los algoritmos de análisis de grafos pueden implementarse directamente en bases de datos de grafos, permitiendo ejecutar técnicas de ML y de análisis de grafos en el mismo entorno, posibilitando una cooperación estrecha entre sí, por ejemplo alimentando los algoritmos ML con métricas gráficas calculadas como variables predictivas; por lo tanto, puede usarse el mismo entorno para llevar a cabo análisis y eficiencia de información e incluso búsquedas compartimentadas, manteniendo la privacidad de la información del paciente.

Aunque las BDR están optimizadas para agregación de datos, otras bases de datos no relaciónales se centran en el volumen y las propiedades de los datos; por ejemplo, las BDG están optimizadas para conexiones de datos: en comparación con otros modelos, las BDG están diseñadas para gestionar un alto nivel de complejidad de datos, en parte debido a que la estructura de los datos no está fijada con antelación. Pero no todo ello son ventajas: las BDG también son más costosas, y hay menos herramientas disponibles para realizar operaciones complejas en un entorno de producción o servicios de mantenimiento.

Descripción de la invención

En un primer aspecto inventivo la invención proporciona un sistema de gestión para una arquitectura de base de datos multimodelo distribuida, comprendiendo la arquitectura de base de datos multimodelo distribuida una pluralidad de microservicios de usuario, cada uno conectado con una base de datos de una pluralidad de bases de datos relaciónales prexistentes almacenadas en respectivos servidores, en donde cada microservicio de usuario está asociado con un usuario, cada microservicio de usuario está configurado para crear, almacenar y gestionar una base de datos de gratos, que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos prexistente conectada con el microservicio de usuario, cada microservicio de usuario comprende un fichero encriptado que puede desencriptarse por el microservicio de usuario y que contiene instrucciones para crear y almacenar la base de datos de gratos con datos relacionados con el usuario asociado, cada microservicio de usuario se almacena en el servidor de la base de datos prexistente conectada al microservicio de usuario, y la base de datos de gratos está configurada para ser accedida únicamente a través del microservicio de usuario; en donde el sistema de gestión se almacena en un servidor en la nube y en donde el sistema de gestión comprende: una interfaz de usuario, una pluralidad de microservicios de perfil, en donde cada microservicio de perfil está asociado con un único usuario distinto, en donde cada microservicio de perfil está conectado con al menos otro microservicio de perfil, y en donde cada microservicio de perfil está configurado para desencriptar los ficheros encriptados de los microservicios de usuario asociados con el mismo usuario al que está asociado el microservicio de perfil, una base de datos clave-valor, conectada con los microservicios de perfil, y configurada para almacenar datos de ubicación con función de hash de cada base de datos de gratos, datos de ubicación con función de hash de los microservicios de perfil, y datos de ubicación con función de hash de los microservicios de usuario, y un software intermedio, configurado para conectar los microservicios de usuario y los microservicios de perfil.

El sistema de gestión proporciona un acceso centralizado a datos almacenados en una pluralidad de bases de datos preexistentes multimodelo independientes distribuidas, con un alto grado de seguridad y sin la pérdida de propiedad por el propietario legítimo de los datos; la arquitectura de base de datos proporciona, para cada base de datos prexistente, o nodo, una pluralidad de microservicios de usuario encargados de la creación de una base de datos de gratos (BDG) específica de usuario exclusivamente con datos relacionados con el usuario a partir de la base de datos prexistente, y de la gestión del acceso y comunicación con el sistema de gestión. Los datos de la base de datos de gratos se almacenan en el servidor de base de datos prexistente y se encriptan. El sistema de gestión únicamente está autorizado a acceder a los microservicios de usuario, y recibe datos encriptados, incluso sin obtener acceso al resto de los datos en la base de datos preexistente; por lo tanto se consigue un alto nivel de seguridad.

Cada microservicio de perfil está asociado con un único usuario, que mantiene preferentemente la propiedad de, o está debidamente autorizado a acceder a ciertos datos en las bases de datos preexistentes. En una disposición convencional, el usuario tendría acceso a las bases de datos individuales y extraería manualmente la información relevante, si la entidad que aloja las bases de datos lo permite. Esto crea dos problemas principales: en primer lugar, una vez que se concede acceso a un usuario a la base de datos, él puede acceder a cualquier registro en la base de datos, incluyendo datos sensibles de otros usuarios, poniendo en peligro por lo tanto la privacidad y seguridad de la base de datos; y en segundo lugar, el usuario tendría que solicitar manualmente y extraer datos relevantes de cada base de datos individual; como resultado, la extracción de datos de varias bases de datos sería costosa en tiempo y recursos.

La presente invención supera tales dificultades y proporciona un sistema de gestión de base de datos centralizado con un único proceso de autenticación a través de una interfaz de usuario, una base de datos clave-valor con un índice con las ubicaciones de cada uno de los datos de usuario, y un software intermedio que gestiona la comunicación entre el sistema de gestión y la arquitectura de base de datos distribuida. Los microservicios de perfil proporcionan una gestión integral de los permisos, las solicitudes de datos y las comunicaciones con la arquitectura de base de datos. El sistema de gestión se aloja mediante un servidor en la nube; por servidor en la nube debe entenderse un ordenador o sistema informático que comprende un procesador, medios de almacenamiento y acceso a Internet, y configurado para alojar y ejecutar el sistema de gestión de base de datos.

A lo largo de todo el presente documento, microservicio debe entenderse como cada una de las aplicaciones de software o elementos de una estructura de microservicio, como es conocido en la técnica. En la presente invención, todos los microservicios están relacionados con usuarios; por ejemplo, puede existir únicamente un único microservicio de perfil para cada usuario, mientras que puede haber más de un microservicio de usuario por usuario; en particular, para cada usuario hay un microservicio de usuario por nodo. Los nombres perfil y usuario deben entenderse como simples denominaciones de conveniencia para una primera clase de microservicios y una segunda clase de microservicios. El microservicio de perfil siempre tendrá una jerarquía superior que el microservicio de usuario, y tendrá la autoridad para leer los ficheros encriptados generados por los microservicios de usuario.

Una base de datos de gratos, o BDG, debe entenderse como cualquiera de una base de datos no relacional o una base de datos de grafos pura, que comprende nodos y vectores, y que almacena datos relacionados con el usuario; Los nodos de una BDG deben entenderse como vértices del grafo, o elementos de datos discretos enlazados mediante vectores o aristas a otros vértices, y son diferentes a los nodos que hacen referencia a estas bases de datos preexistentes.

La base de datos clave-valor, debe entenderse como una tabla de función de hash que comprende al menos un índice de la ubicación de cada registro de datos almacenado en las bases de datos de grafos relacionadas con cada usuario único, así como otros datos relevantes.

El software intermedio es un elemento configurado para posibilitar y gestionar la comunicación y la transferencia de datos entre la arquitectura de base de datos, en particular los microservicios de usuario, y el sistema de gestión.

La presente invención es de interés particular para la gestión de registros de paciente en un sistema de salud con una pluralidad de bases de datos poco relacionadas o independientes que pertenecen a instituciones sanitarias autónomas o independientes. Un paciente, propietario legítimo de datos relevantes tales como registros de paciente, historial médico, etc., puede acceder a la información almacenada en bases de datos hospitalarias separadas y mantener la propiedad de esos datos; adicionalmente, un doctor, facultativo médico o similares, puede acceder a los datos de sus pacientes también, con la condición de que el facultativo médico haya concedido permisos al propietario legítimo de los datos.

En una realización particular, la interfaz de usuario es una interfaz de usuario basada en web. Una interfaz basada en web asegura que cualquier usuario pueda acceder a la información desde cualquier parte en el mundo, proporcionando que el usuario posea los permisos requeridos.

En una realización particular, la base de datos clave-valor está configurada como un libro mayor distribuido. Más particularmente la base de datos clavel valor está configurada como un libro mayor distribuido (distributed iedger) de cadenas de bloques ( blockchain ), de manera que puede notificarse cualquier intento de manipulación de la información almacenada por un usuario malicioso puede y rastrearse por un usuario autorizado.

En una realización particular, la base de datos clave-valor comprende pares clave-valor encriptados con un algoritmo de encriptación de clave pública. Como una medida de seguridad adicional, la base de datos clave-valor se encripta usando un sistema de criptografía asimétrica, que incluye al menos una clave pública y una clave privada.

En una realización particular, la base de datos clave-valor comprende un gestor de base de datos clave-valor.

En una realización particular, el sistema comprende adicionalmente una base de datos de respaldo de baja disponibilidad controlada por el software intermedio.

En una realización particular, el software intermedio se almacena parcialmente en un servidor de la base de datos prexistente. Ventajosamente, parte del software intermedio está distribuido a través de los nodos de los servidores de bases de datos prexistentes, y está almacenado en los correspondientes servidores de bases de datos, con un grado de integración superior.

En una realización particular, el software intermedio está configurado como una red entre pares (peer-to-peer network).

En una realización particular, el software intermedio está configurado para realizar replicación sin maestro síncrono entre nodos de las bases de datos de gratos.

En una realización particular, el software intermedio está configurado para realizar consultas de multidifusión de acuerdo con una planificación por orden cíclico. En una realización particular, al menos un microservicio de perfil comprende una base de datos intermedia configurada para almacenar datos de las bases de datos de gratos, datos de ubicación con función de hash de los microservicios de usuario, y/o claves de desencriptación. Las bases de datos intermedias son bases de datos específicas de usuario de pequeño volumen para el almacenamiento de diversos datos, tales como las ubicaciones de los microservicios y las claves de encriptación/desencriptación; estas bases de datos intermedias funcionan como almacenamientos locales de información y posibilitan un acceso más rápido a una consulta de un usuario.

En un segundo aspecto inventivo, la invención proporciona un sistema informático que comprende un servidor en la nube configurado para almacenar y ejecutar el sistema de gestión de acuerdo con el primer aspecto inventivo. El sistema informático comprende al menos un servidor en la nube con conexión a Internet, y opcionalmente ordenadores adicionales y/o dispositivos similares tales como dispositivos portátiles, tabletas, teléfonos inteligentes, y similares.

En un tercer aspecto inventivo, la invención proporciona una arquitectura de base de datos multimodelo distribuida, que comprende una pluralidad de microservicios de usuario, cada uno conectado con una base de datos de una pluralidad de bases de datos relaciónales prexistentes almacenadas en respectivos servidores, en donde cada microservicio de usuario está asociado con un usuario, cada microservicio de usuario está configurado para crear, almacenar y gestionar una base de datos de gratos, que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos prexistente conectada con el microservicio de usuario, cada microservicio de usuario comprende un fichero encriptado que puede desencriptarse por el microservicio de usuario y que contiene instrucciones para crear y almacenar la base de datos de gratos con datos relacionados con el usuario asociado, y cada microservicio de usuario se almacena en el servidor de la base de datos prexistente conectada al microservicio de usuario, la base de datos de gratos está configurada para ser accedida únicamente a través del microservicio de usuario.

Los microservicios de usuario hacen uso de respectivos ficheros encriptados para crear o construir la base de datos de grafos; tal fichero encriptado comprende las instrucciones específicas para la tarea y están encriptadas para evitar amenazas de seguridad. Por lo tanto, la arquitectura de base de datos multimodelo distribuida proporciona ventajosamente una base de datos sustituía con un modelo normalizado, independientemente del tipo de bases de datos preexistentes.

En una realización particular, el fichero enchptado está enchptado con un algoritmo de encriptación de clave pública. Los algoritmos de encriptación de clave pública proporcionan ventajosamente un sistema de encriptación asimétrica altamente seguro que puede resistir la mayoría de los intentos de ataque sin requerir una carga de procesamiento o tiempos de procesamiento altos.

En una realización particular, el fichero enchptado comprende uno o más de lo siguiente: datos de usuario, funciones de hash, metadatos, claves de encriptación. El fichero encriptado almacena ventajosamente las instrucciones para crear, o construir, la base de datos de gratos, y otros datos útiles que aseguran el acceso a la base de datos de gratos y la seguridad de la información; además, el fichero encriptado puede almacenar directamente ciertos datos, en lugar de simplemente apuntar a una dirección diferente.

En una realización particular, el fichero encriptado se codifica como un fichero JSON. El fichero formateado como JSON comprende preferentemente las instrucciones para crear o construir, la base de datos de gratos, así como ubicaciones con función de hash, metadatos, y claves de encriptación para datos encriptados que no se almacenan directamente en la base de datos de gratos; ejemplos de tales datos no almacenados directamente en la base de datos de gratos son ficheros DICOM, vídeos de alta resolución o ficheros grandes.

En una realización particular, los datos de las bases de datos de gratos están encriptados con un algoritmo de encriptación de clave pública. Ventajosamente, la encriptación de los datos de la BDG evita cualquier posible ataque de un usuario malicioso que acceda a la base de datos.

En una realización particular, los datos de las bases de datos de gratos se codifican de acuerdo con estándares médicos DICOM y/o HL7 FHIFi. El cumplimiento con los estándares médicos, tales como DICOM y/o HL7 FHIR asegura la compatibilidad de datos de diferentes fuentes, tales como datos de las bases de datos internas de hospitales, clínicas, centros de investigación y/o universidades. Adicionalmente, en una realización, el software intermedio comprende exportar interfaces configuradas para emitir ficheros compatibles normalizados con datos de las bases de datos.

En una realización particular, los datos de las bases de datos de gratos se codifican como ficheros JSON. El formato JSON es un formato de fichero altamente versátil que asegura la interoperabilidad de los microservicios y la compatibilidad con las bases de datos preexistentes. En un cuarto aspecto inventivo, la invención proporciona un método para gestionar una arquitectura de base de datos multimodelo distribuida de acuerdo con el tercer aspecto inventivo con un sistema de gestión de acuerdo con el primer aspecto inventivo, en donde el método comprende las etapas de: recibir, por un microservicio de perfil, una solicitud de datos desde una interfaz de usuario, solicitar, por un microservicio de perfil, la ubicación de datos en una o más bases de datos de gratos a la base de datos clave-valor, transferir, por un microservicio de perfil, la solicitud de datos y la ubicación de datos al software intermedio, transferir, por el software intermedio, la solicitud de datos a uno o más de los microservicios de usuario de las bases de datos de gratos donde se almacenan los datos solicitados, recibir, por el software intermedio, datos encriptados desde el uno o más microservicios de usuario, transferir, por el software intermedio, la información encriptada al microservicio de perfil.

En un quinto aspecto inventivo, la invención proporciona un medio legible por ordenador que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador lleve a cabo las etapas de: recibir, por un microservicio de perfil, una solicitud de datos desde una interfaz de usuario, solicitar, por un microservicio de perfil, la ubicación de datos en una o más bases de datos de gratos a la base de datos clave-valor, transferir, por un microservicio de perfil, la solicitud de datos y la ubicación de datos al software intermedio, transferir, por el software intermedio, la solicitud de datos a uno o más de los microservicios de usuario de las bases de datos de gratos donde se almacenan los datos solicitados, recibir, por el software intermedio, datos encriptados desde el uno o más microservicios de usuario, transferir, por el software intermedio, la información encriptada al microservicio de perfil.

Descripción de los dibujos

Las ventajas y características anteriores y otras se entenderán más completamente a partir de la siguiente descripción detallada de realizaciones de ejemplo con referencia a los dibujos adjuntos, que deben considerarse por medio de ilustración y no limitación, en los que:

La Figura 1 muestra una realización preferida del sistema de gestión.

La Figura 2 muestra una realización preferida de la arquitectura de base de datos. La Figura 3 muestra otro aspecto de una realización de la arquitectura de base de datos.

La Figura 4 muestra una realización preferida del sistema de gestión y la arquitectura de base de datos.

La Figura 5 muestra la estructura física del sistema de gestión y la arquitectura de base de datos.

Realización preferida de la invención

La invención es particularmente adecuada para la gestión de datos médicos almacenados en una pluralidad de bases de datos locales de instituciones médicas, tales como hospitales, clínicas y similares; estas bases de datos normalmente contienen datos de un número alto de pacientes y en su mayoría contienen datos sensibles; en arquitecturas convencionales, el acceso a los datos de un único paciente conllevaría la concesión de acceso a la totalidad del conjunto de datos de todos los pacientes, así como requeriría la obtención de acceso individual a cada base de datos. Por consiguiente, los usuarios son pacientes, pero también médicos e investigadores que desean obtener datos anónimos de una amplia gama de fuentes.

La Figura 1 muestra una realización preferida del sistema de gestión (1); el sistema de gestión (1) comprende una pluralidad de microservicios de perfil (3), de los cuales únicamente se representan tres en esta figura, conectados entre sí y a la interfaz de usuario (2). La interfaz de usuario (2) es preferentemente una aplicación web, accesible desde cualquier dispositivo con conexión a internet.

En una realización, los microservicios de perfil (3) están agrupados por contenedores de un conjunto de productos de software de plataforma como un servicio ( platform as a Service, PaaS) que usan virtualización de nivel de Sistema Operativo para entregar el software en paquetes denominados contenedores. Estos contenedores están aislados entre sí y agrupan su propio software, bibliotecas y ficheros de configuración; los contenedores pueden comunicarse entre sí a través de canales bien definidos. Todos los contenedores se ejecutan por un único núcleo de sistema operativo y por lo tanto usan menos recursos que las máquinas virtuales. Los microservicios de perfil (3) también comprenden una base de datos intermedia en el caso de que el usuario desee almacenar datos permanentemente en el servidor en la nube (10). En la práctica, los microservicios de perfil (3) actúan como una representación virtual de los usuarios y tienen autoridad total sobre los datos de propiedad del usuario.

En este ejemplo, la base de datos clave-valor (4) es una tabla de funciones de hash basada en cadena de bloques con la ubicación de los datos de cada usuario en la arquitectura de base de datos (20). El software intermedio (5) es un sistema de gestión de base de datos distribuido NoSQL con arquitectura peer-to-peer que proporciona una alta disponibilidad entre múltiples nodos de datos, con replicación sin maestro asincrona entre nodos instalados dentro de bases de datos locales (30) y el sistema de gestión (1). El software intermedio (5) puede ejecutar consultas de multidifusión a un número de microservicios de usuario (11) mediante un sistema de planificación por orden cíclico; los únicos microservicios de usuario (11) que responden a la consulta, son los microservicios de usuario (11) que contienen los datos y han sido autorizados por el usuario para compartirlos.

El esquema general de la arquitectura de base de datos multimodelo distribuida (20) se muestra en la Figura 3, que representa cuatro bases de datos (30) o nodos. La arquitectura de base de datos multimodelo distribuida (20) es esencialmente una base de datos federada con una pluralidad de bases de datos relaciónales prexistentes (30), datos que se gestionan en una base por usuario por una pluralidad de microservicios de usuario (11), en una forma tal que únicamente se extraen ciertos datos de propiedad por el usuario desde la base de datos (30), se reorganizan en una base de datos de grafos específica de usuario (12) y se encriptan con un algoritmo de clave pública, todo de acuerdo con las instrucciones de un fichero encriptado (13).

La Figura 3 muestra una vista simplificada de la arquitectura de base de datos (20) con cuatro bases de datos (30) y un único microservicio de usuario (11) por base de datos (30), mientras que normalmente cada base de datos (30) estará asociada a una pluralidad de microservicios (11), normalmente uno por usuario. La Figura 2 muestra una vista de una posible realización de uno de los nodos de la arquitectura de base de datos (20), con una única base de datos (30) y cuatro microservicios de usuario (11); También, cada microservicio de usuario (11) está conectado a su correspondiente base de datos de grafos (12) y fichero encriptado (13).

La Figura 4 muestra el sistema de gestión (1) junto con la arquitectura de base de datos multimodelo distribuida (20), representado por dos nodos únicamente.

La Figura 5 muestra una implementación preferida del sistema de gestión (1) y la arquitectura de base de datos distribuida (20); la Figura muestra el microservicio de perfil (3), la base de datos clave-valor (4) y parte del software intermedio (5) alojado en el servidor en la nube (10); la interfaz de usuario (2) en este ejemplo es una aplicación web. Por otra parte, los servidores de base de datos (31), de los que únicamente se representa una unidad en la Figura 5, alojan los microservicios de usuario (11), de los que únicamente se representa una unidad en la Figura 5, la misma base de datos prexistente (30) y una parte del software intermedio (5). En la base de datos de gratos (12), la estructura de datos se implementa mediante un grato con estructura similar a árbol en documentos que almacenan referencias a nodos "padres" en nodos hijos. El "patrón de referencias padre" almacena cada nodo de árbol en un documento; además del nodo de árbol, el documento almacena la identificación, o ID, del padre del nodo. El desafío de clave en el modelado de datos es el equilibrio de las necesidades de la aplicación, las características de rendimiento del motor de base de datos, y los patrones de recuperación de datos. A diferencia de SQL, o las bases de datos convencionales, donde debe determinarse un esquema de tabla y declararse antes de insertar datos, las colecciones de bases de datos de gratos, por defecto, no requieren que sus documentos tengan el mismo esquema. Los documentos en una única colección no necesitan tener el mismo conjunto de campos y el tipo de datos para un campo puede diferir a través de documentos dentro de una colección. Para cambiar la estructura de los documentos en una colección, tal como añadir nuevos campos, eliminar campos existentes o cambiar los valores de campo a un nuevo tipo, se actualizan los documentos a la nueva estructura. Esta flexibilidad facilita el mapeo de documentos a una entidad o un objeto. Cada documento puede adaptar los campos de datos de la entidad representada, incluso si el documento tiene variación sustancial de otros documentos en la colección. La decisión clave al diseñar modelos de datos para aplicaciones de base de datos de grafos gira en torno a la estructura de documentos y cómo la aplicación representa relaciones entre datos.

En un ejemplo preferido, la arquitectura de base de datos (20) no es compatible únicamente con estándares médicos tales como DICOM y HL7, el software intermedio (5) también comprende interfaces de exportación a estos formatos, de manera que la arquitectura de base de datos (20) es completamente compatible con el sistema hospitalario existente e independiente de los proveedores de servicio de software.

Adicionalmente, el acceso a los datos es únicamente posible a través de los microservicios de usuario (11), y con la condición de que la solicitud se autorice debidamente con la correspondiente clave. Los datos se encriptan de tal manera que los microservicios de perfil (3) siempre tienen una autoridad superior para desencriptar los datos.

La ubicación de datos es conocida a través de la jerarquía establecida por el árbol, y el coste que tiene pasar de un nodo a otro para construir nuestra estructura de datos necesaria en cada momento. Por consiguiente, el algoritmo Dijkstra es el algoritmo preferido para construir la red de datos. Se usará un algoritmo de ruta mínimo, es decir, un algoritmo para la determinación de la ruta más corta entre nodos. Una vez que es conocida la ubicación de los ficheros en cada uno de los nodos (hospitales), es posible ejecutar el algoritmo para reconstruir el mismo árbol de datos. Si cualquiera de los nodos sufre cambios en las rutas de fichero, tendremos que reconstruir el árbol usando el mismo patrón.

Para solicitar un registro de datos después de la solicitud de un usuario debidamente autorizado, el sistema de gestión (1) ejecuta estas etapas: recibir, por un microservicio de perfil (3), una solicitud de datos desde una interfaz de usuario

(2), solicitar, por un microservicio de perfil (3), la ubicación de datos en una o más bases de datos de gratos (12) a la base de datos clave-valor (4), transferir, por un microservicio de perfil (3), la solicitud de datos y la ubicación de datos al software intermedio (5), transferir, por el software intermedio (5), la solicitud de datos a uno o más microservicios de usuario (11) de las bases de datos de gratos (12) donde se almacenan los datos solicitados, recibir, por el software intermedio (5), datos encriptados desde el uno o más microservicios de usuario (11), transferir, por el software intermedio (5), la información encriptada al microservicio de perfil (3).

Cláusulas de la invención

1. Sistema de gestión (1) para una arquitectura de base de datos multimodelo distribuida (20), arquitectura de base de datos multimodelo distribuida (20) que comprende una pluralidad de microservicios de usuario (11), cada uno conectado con una base de datos (30) de una pluralidad de bases de datos relaciónales prexistentes (30) almacenadas en respectivos servidores (31), en donde cada microservicio de usuario (11) está asociado con un usuario, cada microservicio de usuario (11) está configurado para crear, almacenar y gestionar una base de datos de gratos (12), que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos prexistente (30) conectada con el microservicio de usuario, cada microservicio de usuario comprende un fichero encriptado (13) que puede desencriptarse por el microservicio de usuario (11) y que contiene instrucciones para crear y almacenar la base de datos de gratos (12) con datos relacionados con el usuario asociado, cada microservicio de usuario (11) se almacena en el servidor (31) de la base de datos prexistente (30) conectada al microservicio de usuario (11), y la base de datos de gratos (12) está configurada para ser accedida únicamente a través del microservicio de usuario (11); en donde el sistema de gestión (1) se almacena en un servidor en la nube (10) y en donde el sistema de gestión (1) comprende: una interfaz de usuario (2), una pluralidad de microservicios de perfil (3), en donde cada microservicio de perfil (3) está asociado con un único usuario distinto, en donde cada microservicio de perfil (3) está conectado con al menos otro microservicio de perfil (3), y en donde cada microservicio de perfil (3) está configurado para desencriptar los ficheros encriptados (13) de los microservicios de usuario (11) asociados con el mismo usuario al que está asociado el microservicio de perfil (3), una base de datos clave-valor (4), conectada con los microservicios de perfil (3), y configurada para almacenar datos de ubicación con función de hash de cada base de datos de grafos (12), datos de ubicación con función de hash de los microservicios de perfil (3), y datos de ubicación con función de hash de los microservicios de usuario (11), y un software intermedio (5), configurado para conectar los microservicios de usuario (11) y los microservicios de perfil (3).

2. Sistema de gestión (1) de acuerdo con la cláusula anterior, en donde la interfaz de usuario (2) es una interfaz de usuario basada en web.

3. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde la base de datos clave-valor (4) está configurada como un libro mayor distribuido.

4. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde la base de datos clave-valor (4) comprende pares clave-valor encriptados con un algoritmo de encriptación de clave pública.

5. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde la base de datos clave-valor (4) comprende un gestor de base de datos clave-valor.

6. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, que comprende adicionalmente una base de datos de respaldo de baja disponibilidad controlada por el software intermedio (5).

7. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde el software intermedio (5) está parcialmente almacenado en un servidor (31) de la base de datos prexistente (30).

8. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde el software intermedio (5) está configurado como una red entre pares.

9. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde el software intermedio (5) está configurado para realizar replicación sin maestro asincrona entre nodos de las bases de datos de grafos (12).

10. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde el software intermedio (5) está configurado para realizar consultas de multidifusión de acuerdo con una planificación por orden cíclico.

11. Sistema de gestión (1) de acuerdo con cualquiera de las cláusulas anteriores, en donde al menos un microservicio de perfil (3) comprende una base de datos intermedia configurada para almacenar datos de las bases de datos de grafos (12), datos de ubicación con función de hash de los microservicios de usuario (11), y/o claves de desencriptación.

12. Sistema informático que comprende un servidor en la nube (10) configurado para almacenar y ejecutar el sistema de gestión (1) de acuerdo con las cláusulas 1-11.

13. Arquitectura de base de datos multimodelo distribuida (20), que comprende una pluralidad de microservicios de usuario (11), cada uno conectado con una base de datos (30) de una pluralidad de bases de datos relaciónales prexistentes (30) almacenadas en respectivos servidores (31), en donde cada microservicio de usuario (11) está asociado con un usuario, cada microservicio de usuario (11) está configurado para crear, almacenar y gestionar una base de datos de grafos (12), que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos preexistente (30) conectada con el microservicio de usuario (11), cada microservicio de usuario (11) comprende un fichero encriptado (13) que puede desencriptarse por el microservicio de usuario (11) y que contiene instrucciones para crear y almacenar la base de datos de grafos (12) con datos relacionados con el usuario asociado, y cada microservicio de usuario (11) se almacena en el servidor (31) de la base de datos prexistente (30) conectada al microservicio de usuario (11), la base de datos de grafos (12) está configurada para ser accedida únicamente a través del microservicio de usuario (11).

14. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con la cláusula anterior, en donde el fichero encriptado (13) se encripta con un algoritmo de encriptación de clave pública.

15. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13-14, en donde el fichero encriptado (13) comprende uno o más de lo siguiente: datos de usuario, funciones de hash, metadatos, claves de encriptación.

16. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13-15, en donde el fichero encriptado (13) se codifica como un fichero JSON.

17. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13-16, en donde los datos de las bases de datos de grafos (12) se encriptan con un algoritmo de encriptación de clave pública.

18. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13-17, en donde los datos de las bases de datos de gratos (12) se codifican de acuerdo con los estándares médicos DICOM y/o HL7 FHIR.

19. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13-18, en donde los datos de las bases de datos de gratos (12) se codifican como ficheros JSON.

20. Método para gestionar una arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las cláusulas 13 a 19 con un sistema de gestión (1) de acuerdo con cualquiera de las cláusulas 1 a 11, en donde el método comprende las etapas de: recibir, por un microservicio de perfil (3), una solicitud de datos desde una interfaz de usuario

21. Medio legible por ordenador que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador lleve a cabo las etapas de: recibir, por un microservicio de perfil (3), una solicitud de datos desde una interfaz de usuario

Claims

REIVINDICACIONES

1. Sistema de gestión (1) para una arquitectura de base de datos multimodelo distribuida (20), arquitectura de base de datos multimodelo distribuida (20) que comprende una pluralidad de microservicios de usuario (11), cada uno conectado con una base de datos (30) de una pluralidad de bases de datos relaciónales prexistentes (30) almacenadas en respectivos servidores (31), en donde cada microservicio de usuario (11) está asociado con un usuario, cada microservicio de usuario (11) está configurado para crear, almacenar y gestionar una base de datos de gratos (12), que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos prexistente (30) conectada con el microservicio de usuario, cada microservicio de usuario comprende un fichero encriptado (13) que puede desencriptarse por el microservicio de usuario (11) y que contiene instrucciones para crear y almacenar la base de datos de gratos (12) con datos relacionados con el usuario asociado, cada microservicio de usuario (11) se almacena en el servidor (31) de la base de datos prexistente (30) conectada al microservicio de usuario (11), y la base de datos de gratos (12) está configurada para ser accedida únicamente a través del microservicio de usuario (11); en donde el sistema de gestión (1) se almacena en un servidor en la nube (10) y en donde el sistema de gestión (1) comprende: una interfaz de usuario (2), una pluralidad de microservicios de perfil (3), en donde cada microservicio de perfil (3) está asociado con un único usuario distinto, en donde cada microservicio de perfil (3) está conectado con al menos otro microservicio de perfil (3), y en donde cada microservicio de perfil (3) está configurado para desencriptar los ficheros encriptados (13) de los microservicios de usuario (11) asociados con el mismo usuario al que está asociado el microservicio de perfil (3), una base de datos clave-valor (4), conectada con los microservicios de perfil (3), y configurada para almacenar datos de ubicación con función de hash de cada base de datos de gratos (12), datos de ubicación con función de hash de los microservicios de perfil (3), y datos de ubicación con función de hash de los microservicios de usuario (11), y un software intermedio (5), configurado para conectar los microservicios de usuario (11) y los microservicios de perfil (3).

2. Sistema de gestión (1) de acuerdo con la reivindicación anterior, en donde la interfaz de usuario (2) es una interfaz de usuario basada en web.

3. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la base de datos clave-valor (4) está configurada como un libro mayor distribuido.

4. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la base de datos clave-valor (4) comprende pares clave-valor encriptados con un algoritmo de encriptación de clave pública.

5. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la base de datos clave-valor (4) comprende un gestor de base de datos clave-valor.

6. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, que comprende adicionalmente una base de datos de respaldo de baja disponibilidad controlada por el software intermedio (5).

7. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde el software intermedio (5) está almacenado parcialmente en un servidor (31) de la base de datos prexistente (30).

8. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde el software intermedio (5) está configurado como una red entre pares.

9. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde el software intermedio (5) está configurado para realizar replicación sin maestro asincrona entre nodos de las bases de datos de grafos (12).

10. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde el software intermedio (5) está configurado para realizar consultas de multidifusión de acuerdo con una planificación por orden cíclico.

11. Sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones anteriores, en donde al menos un microservicio de perfil (3) comprende una base de datos intermedia configurada para almacenar datos de las bases de datos de grafos (12), datos de ubicación con función de hash de los microservicios de usuario (11), y/o claves de desencriptación.

12. Sistema informático que comprende un servidor en la nube (10) configurado para almacenar y ejecutar el sistema de gestión (1) de acuerdo con las reivindicaciones 1-11.

13. Arquitectura de base de datos multimodelo distribuida (20), que comprende una pluralidad de microservicios de usuario (11), cada uno conectado con una base de datos (30) de una pluralidad de bases de datos relaciónales prexistentes (30) almacenadas en respectivos servidores (31), en donde cada microservicio de usuario (11) está asociado con un usuario, cada microservicio de usuario (11) está configurado para crear, almacenar y gestionar una base de datos de gratos (12), que comprende nodos y aristas, con datos relacionados con el usuario asociado de la base de datos preexistente (30) conectada con el microservicio de usuario (11), cada microservicio de usuario (11) comprende un fichero encriptado (13) que puede desencriptarse por el microservicio de usuario (11) y que contiene instrucciones para crear y almacenar la base de datos de gratos (12) con datos relacionados con el usuario asociado, y cada microservicio de usuario (11) se almacena en el servidor (31) de la base de datos prexistente (30) conectada al microservicio de usuario (11), la base de datos de gratos (12) está configurada para ser accedida únicamente a través del microservicio de usuario (11).

14. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con la reivindicación anterior, en donde el fichero encriptado (13) está encriptado con un algoritmo de encriptación de clave pública.

15. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13-14, en donde el fichero encriptado (13) comprende uno o más de lo siguiente: datos de usuario, funciones de hash, metadatos, claves de encriptación.

16. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13-15, en donde el fichero encriptado (13) se codifica como un fichero JSON.

17. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13-16, en donde los datos de las bases de datos de grafos (12) se encriptan con un algoritmo de encriptación de clave pública.

18. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13-17, en donde los datos de las bases de datos de grafos (12) se codifican de acuerdo con los estándares médicos DICOM y/o HL7 FHIR.

19. Arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13-18, en donde los datos de las bases de datos de gratos (12) se codifican como ficheros JSON.

20. Método para gestionar una arquitectura de base de datos multimodelo distribuida (20) de acuerdo con cualquiera de las reivindicaciones 13 a 19 con un sistema de gestión (1) de acuerdo con cualquiera de las reivindicaciones 1 a 11, en donde el método comprende las etapas de: recibir, por un microservicio de perfil (3), una solicitud de datos desde una interfaz de usuario