WO2023084276A1

WO2023084276A1 - Método implementado por computador para el entrenamiento automático de algoritmos de detección temprana de enfermedades usando imágenes diagnósticas

Info

Publication number: WO2023084276A1
Application number: PCT/IB2021/060421
Authority: WO
Inventors: Nicolás MUNERA GARZÓN; José David GÓMEZ ZEA; Álvaro José GONZÁLEZ GRAJALES; Laura VELÁSQUEZ HERRERA; Daniel Alberto LÓPEZ SANCHEZ
Original assignee: Arkangel Ai S.A.S.
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2023-05-19

Abstract

La presente invención se relaciona con un método implementado por computador para el entrenamiento automático de algoritmos que permiten llevar a cabo la detección temprana de enfermedades mediante el uso de imágenes diagnósticas, en donde dicho proceso es desplegado en la nube y se basa en la disposición de una interfaz gráfica a la que se accede por internet, donde el médico o profesional de la salud ingresa el conjunto de datos a entrenar, tales como vídeos o imágenes diagnósticas, en un formato específico, preferiblemente formato comprimido, con sus respectivas anotaciones en un archivo plano que incluye el diagnóstico final dado por el especialista, las coordenadas de las lesiones dentro de la imagen e información de síntomas relevantes para el diagnóstico del paciente. Una vez recibido los datos, un servidor diseñado para el entrenamiento de algoritmos inicia la experimentación mediante redes neuronales convolucionales probando múltiples arquitecturas y variando hiper parámetros para obtener el mejor algoritmo de forma automática y después de cientos de intentos. De este modo, el proceso de la invención se encarga de realizar cientos de experimentos con múltiples configuraciones de algoritmos y seleccionar el algoritmo de visión por computadora con mayor precisión para el caso de uso.

Description

MÉTODO IMPLEMENTADO POR COMPUTADOR PARA EL ENTRENAMIENTO AUTOMÁTICO DE ALGORITMOS DE DETECCIÓN TEMPRANA DE ENFERMEDADES USANDO IMÁGENES DIAGNÓSTICAS

CAMPO TÉCNICO

La presente invención se ubica dentro del campo técnico de la ingeniería electrónica y las ciencias de la computación, y más específicamente con aparatos que permiten desarrollar procesos basados en algoritmos para detección temprana de enfermedades.

Así, la presente invención está dirigida a un método implementado por computador para el entrenamiento automático de algoritmos que permiten llevar a cabo la detección temprana de enfermedades mediante el uso de imágenes diagnósticas, en donde dicho proceso es desplegado en la nube y se basa en la disposición de una interfaz gráfica a la que se accede por internet, donde el médico o profesional de la salud ingresa el conjunto de datos a entrenar, tales como vídeos o imágenes diagnósticas, en un formato específico, preferiblemente formato comprimido, con sus respectivas anotaciones en un archivo plano que incluye el diagnóstico final dado por el especialista, las coordenadas de las lesiones dentro de la imagen e información de síntomas relevantes para el diagnóstico del paciente. Una vez recibido los datos, un servidor diseñado para el entrenamiento de algoritmos inicia la experimentación mediante redes neuronales convolucionales probando múltiples arquitecturas y variando hiper parámetros para obtener el mejor algoritmo de forma automática y después de cientos de intentos. De este modo, el proceso de la invención se encarga de realizar cientos de experimentos con múltiples configuraciones de algoritmos y seleccionar el algoritmo de visión por computadora con mayor precisión para el caso de uso.

ANTECEDENTES DE LA INVENCIÓN Actualmente, el uso de tecnologías de computación en el campo de las ciencias médicas es una ayuda muy deseada, toda vez que los profesionales de la salud pueden realizar un diagnóstico de forma más precisa y rápida a partir de una serie de parámetros predefinidos o precargados de acuerdo con experiencias pasadas o imágenes que se han obtenido de pacientes analizados previamente y de los que se tiene un diagnóstico ya establecido.

De este modo, la mayoría de los sistemas de computación y tecnologías que se utilizan para dicho fin se basan en aprendizaje de máquina o “machine learning” como se conoce usualmente, lo cual se basa en inteligencia artificial que permite que el mismo programa aprenda de las experiencias y diagnósticos realizados y así, cada vez es más preciso el diagnóstico realizado.

Así las cosas, en el estado del arte existe una pluralidad de divulgaciones relacionadas con dispositivos o herramientas, en general, que pueden ser usadas para ayudar a médicos o profesionales de la salud a la hora de realizar un diagnóstico de forma automática, dentro de las que se encuentra el documento US 201901 10753 relacionado con sistemas, métodos, dispositivos, y medios para llevar a cabo diagnóstico médico de enfermedades y condiciones oftalmológicas, donde éstos se basan en algoritmos de aprendizaje profundo que permite el análisis automático de imágenes oftalmológicas para generar una serie de predicciones de precisión comparable a expertos clínicos. Así, el método definido en esta anterioridad es un método implementado por computador al cual se le debe ingresar una imagen oftalmológica de un individuo, para luego evaluar dicha imagen usando un clasificador de aprendizaje por máquina para generar una determinación de la enfermedad, condición, o desorden oftalmológico, dicha determinación tiene una sensibilidad de por lo menos 90% y una especificidad de al menos 90% cuando se prueba contra datos independiente de una serie de datos. Finalmente, esta información de determinación es suministrada o mostrada al individuo o a un tercero involucrado, tal como un médico o profesional de la salud. De otra parte, se tiene el documento WO 2016094330 que divulga una serie de métodos y pruebas no invasivas para medir biomarcadores, tales como antígenos de tumores, y recolectar parámetros clínicos de pacientes. Esta anterioridad también enseña métodos implementados por computador de aprendizaje por computador, para evaluar una probabilidad que un paciente tenga una enfermedad, con relación a una población de pacientes o una cohorte definida. Así, se genera un clasificador usando un sistema de aprendizaje de máquina basado en datos de entrenamiento de datos retrospectivos y un conjunto de entradas, tales como biomarcadores y un parámetro clínico, en donde cada entrada tiene un peso asociado y el clasificador cumple con una estadística de característica de operador receptor, que especifica una sensibilidad y una especificidad, para la correcta clasificación de pacientes. Luego, el clasificador puede ser usado para evaluar la probabilidad que un paciente tenga cáncer.

Finalmente, está el documento CN 106980899 que enseña un modelo de aprendizaje profundo y un sistema para predecir características de flujo sanguíneo en un vaso sanguíneo de un árbol de vasos sanguíneos, donde el modelo de aprendizaje profundo comprende una red neural que se establece para cada punto de la trayectoria de vaso sanguíneo, recibe por lo menos uno de características de imagen, características estructurales y características funcionales de cada punto en el vaso sanguíneo como entrada, y predice las características de flujo sanguíneo de cada punto en el vaso sanguíneo como salida. Así, el modelo de aprendizaje profundo puede predecir de forma rápida y precisa las características de flujo sanguíneo sobre toda la trayectoria de vaso sanguíneo, y la eficiencia del cálculo se mejora de forma considerable.

Ahora, partiendo del conocimiento existente en el estado del arte, y basándose en los documentos del arte previo como se mencionan anteriormente, si bien el aprendizaje de máquina ha demostrado múltiples beneficios en el apoyo de diagnóstico de enfermedades en la industria de la salud, su utilización requiere de un conocimiento en ciencias de datos que la mayoría del personal de la salud no posee. Así, el problema que existe en la actual reside en que, a pesar que los médicos o profesionales de la salud poseen amplios bancos de datos de imágenes diagnósticas, conocimiento en práctica médica e interpretación de datos clínicos, ellos no tienen el conocimiento en ciencia de datos para crear algoritmos de aprendizaje de máquina por sí mismos. Y a pesar de que algunas instituciones entienden el gran valor que la ciencia de datos trae a su organización, el proceso interactivo toma mucho tiempo, es muy costoso y el talento necesario no suele estar disponible, especialmente en entornos sanitarios.

Así las cosas, se puede ver que en los dispositivos divulgados en el arte previo todos presentan el inconveniente y la desventaja que requieren de un conocimiento alto en términos tecnológicos y ciencias de la computación, hecho que es muy difícil de cumplir con los profesionales de la salud, toda vez que ellos se enfocan en su campo de experticia, y no tienen el conocimiento o el tiempo para programar o escribir un código que permita hacer estos diagnósticos de forma automática.

De acuerdo con la información anterior, es claro para el experto en la materia que en el estado del arte existe una necesidad por diseñar e implementar un método, proceso, sistema, dispositivo o aparato, que permita a instituciones sanitarias, médicos o investigadores entrenar modelos de aprendizaje automático de forma autónoma, personalizados para sus propios casos de uso y sin escribir una línea de código, donde los profesionales de la salud con poca o nula experiencia en aprendizaje de máquina (es decir, machine learning) solamente deben cargar su conjunto de datos estructurados, a través una interfaz gráfica y el dispositivo transforme ese conjunto de datos reales en un algoritmo descargadle y listo para ser usado en campo, de forma rápida, confiable y económica.

BREVE DESCRIPCIÓN DE LA INVENCIÓN Considerando los problemas y/o necesidades anteriores mencionadas, los presentes inventores han propuesto un nuevo método implementado por computador, el cual está diseñado para ser utilizado por expertos de salud que tengan colecciones de videos o imágenes médicas y que deseen obtener modelos de visión por computadora basado en aprendizaje automático a partir de esos mismos datos, en donde el médico o profesional desde una interfaz gráfica, sube los videos o imágenes médicas reales, así como una serie de anotaciones respectivas en un archivo plano, da una instrucción en dicha interfaz gráfica e inicia la creación de algoritmos.

De acuerdo con la información cargada directamente por el médico o profesional de la salud, todos los modelos resultantes luego de aplicar el método o proceso de la presente invención son evaluados internamente de forma automática y se le presentan a dicho usuario (médico o profesional de la salud) una señe de algoritmos, tal como tres, con mayor precisión en un conjunto de validación escogido de forma aleatoria de los datos que se suministrados al comienzo. Finalmente, el médico puede descargar el modelo más adecuado desde la interfaz gráfica y usarlo en campo.

Así, al iniciar el proceso el usuario debe seleccionar la variable de optimización que realizará el método sobre la información suministrada, donde dicha variable de optimización puede ser para optimizar para mayor precisión o para mayor velocidad, y una vez se selecciona esta variable, se procede al envío de una señe de imágenes o archivos, preferiblemente en formato comprimido, con una tabulación con valores separados por coma de diagnósticos dados por el especialista médico y cualquier otra variable que se pueda tener del caso concreto, donde toda esta información contará también con las imágenes diagnósticas para el entrenamiento.

Estos documentos o archivos son enviados directamente a una estación remota, tal como un servidor que los recibe y empieza el proceso. Así, si la carga de los documentos en la estación remota o servidor es exitosa, el usuario recibirá una respuesta positiva y allí es donde comienza el método como tal de creación de un servidor de entrenamiento dentro del método implementado por computador de la presente invención.

La información recibida en dicho servidor es almacenada y clasificada, al tiempo que se verifican dichos datos, y en caso de presentarse un error se retorna el mismo al usuario y se envía una confirmación o acción a seguir por parte de éste para corregir lo que se requiera.

Posteriormente, se procede a recopilar y fragmentar los datos con el fin de dividirlos en datos de entrenamiento, datos de prueba o testeo, y datos de validación, los cuales luego serán preprocesados mediante su almacenamiento en paquetes de datos de dos dimensiones con nombres identificables para entrenamiento, prueba y validación.

Luego, se procede a generar una serie de parámetros de entrenamiento, los cuales se seleccionan una vez la información es preprocesada usando una lista de valores que hayan funcionado previamente para la construcción de algoritmos de detección temprana de enfermedades usando imágenes diagnósticas.

Una vez se tienen los parámetros de entrenamiento generados, se crean y optimizan múltiples en simultáneo, almacenando dicho algoritmo en una instancia de modelo, usando los datos de prueba para obtener las mediciones de desempeño sobre la instancia de modelo durante esta etapa de entrenamiento y descartando los modelos de menor rendimiento.

Posteriormente, una vez creada la instancia de modelo, se seleccionan las instancias de modelo de mejor rendimiento y se utiliza el conjunto de datos de prueba para determinar las métricas estadísticas de desempeño incluyendo una matriz de confusión, un reporte completo de clasificación, unas métricas de precisión, entre otros. Cuando se ha obtenido las evaluaciones de los modelos de acuerdo con lo definido anteriormente, se procede a seleccionar el mejor algoritmo entrenado, ordenando de forma descendente los mejores modelos según la métrica de optimización enviada por el usuario en la primera etapa, es decir, de acuerdo con la variable de optimización seleccionada.

Finalmente, una vez se han seleccionado los mejores algoritmos, se envía al usuario el algoritmo seleccionado en un formato predefinido para su descarga y las métricas de desempeño obtenidas en el conjunto de datos de prueba, al tiempo que se envía la información al usuario final por medio del servidor en un llamado a la plataforma de administración que utiliza el usuario para crear así el algoritmo con la información del entrenamiento.

BREVE DESCRIPCIÓN DE LAS FIGURAS

La presente invención se entiende de forma más clara a partir de las siguientes figuras donde se muestran los pasos asociados al presente método y/o proceso, así como los elementos novedosos con respecto al estado del arte, en donde las figuras no pretenden limitar el alcance de la invención, el cual está únicamente dado por las reivindicaciones adjuntas, en donde:

La Figura 1 corresponde a un diagrama esquemático que muestra el flujo de interacción de los pasos del método mostrando por separado la sección del usuaño/cliente y el servidor remoto donde se lleva a cabo el método de la presente invención.

La Figura 2 corresponde a un diagrama de flujo general del método implementado por computador de la presente invención, donde se ¡lustran las etapas que forman parte del mismo.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La presente invención está dirigida a un método implementado por computador para el entrenamiento automático de algoritmos que permiten llevar a cabo la detección temprana de enfermedades mediante el uso de imágenes diagnósticas, donde el médico o profesional de la salud ingresa el conjunto de datos a entrenar, tales como vídeos o imágenes diagnósticas, en un formato específico, con sus respectivas anotaciones que incluyen el diagnóstico final dado por el especialista, las coordenadas de las lesiones dentro de la imagen e información de síntomas relevantes para el diagnóstico del paciente.

De esta forma, las Figuras 1 y 2 presentan un método para entrenamiento de detección temprana de enfermedades con base en imágenes diagnósticas, en donde dicho método es implementado por computador y comprende o consiste esencialmente, en general, sin limitaciones, de las siguientes etapas o pasos: a. Enviar información por parte del usuario, desde su sistema de computación hacia una plataforma remota o servidor, donde dicha información incluye nombre de identificación del algoritmo a construir, tipo de predicción, columna objetivo de predicción, nombres de otras columnas, métrica estadística de optimización, número de horas de entrenamiento, variable de optimización general, y el conjunto de datos en un archivo que pueda ser interpretado y leído fácilmente por dicho servidor; b. Almacenar y clasificar la información recibida por parte de usuario, donde dicho almacenamiento y clasificación se hace en el servidor y permite realizar la verificación de los datos enviados por dicho servidor. Así, en caso de presentarse error en algún dato recibido, se retorna dicho error, y en caso de éxito se continúa con los pasos posteriores del método y se envía una confirmación de éxito al usuario; c. Fragmentar los datos previamente almacenados y clasificados dividiéndolos en datos de entrenamiento, datos de prueba o testeo, y datos de validación; d. Preprocesar los datos fragmentados almacenándolos en un paquete de datos de dos dimensiones con nombres identif ¡cables para entrenamiento, prueba y validación; e. Generar parámetros de entrenamiento a partir de la información o datos preprocesados seleccionando los parámetros de entrenamiento con base en una lista de valores que hayan funcionado previamente para la construcción de algoritmos de detección temprana de enfermedades usando imágenes diagnósticas; f. Crear y optimizar modelos a partir de los parámetros de entrenamiento generados, mediante el envío del listado de parámetros e iniciando entrenamiento con los datos de entrenamiento de múltiples modelos en simultáneo, permitiendo almacenar dicho algoritmo en una instancia de modelo, usar los datos de testeo para obtener las métricas de desempeño sobre dicha instancia de modelo durante esta etapa de entrenamiento e ir descartando los modelos de menor rendimiento; g. Evaluar los modelos creados y optimizados una vez creada la instancia de modelo, mencionada previamente, seleccionando las mejores instancias de modelo que presentan el mejor rendimiento y con base en el conjunto de datos de prueba, determinar las métricas estadísticas de desempeño; h. Seleccionar el mejor algoritmo entrenado, una vez se cuentan con todas las evaluaciones para las instancias de modelos entrenados, ordenando en cierto orden determinado los mejores modelos según la métrica estadística de optimización seleccionada por el usuario; y i. Enviar la información final de regreso al usuario que corresponde a los mejores algoritmos seleccionados, donde dicha información es almacenada y clasificada para mostrar los resultados en la plataforma de almacenamiento de datos, enviando el algoritmo seleccionado en un formato para descarga por parte del usuario.

Así las cosas, el método implementado por computador de la presente invención permite obtener como resultado el mejor algoritmo para el entrenamiento de diagnóstico de enfermedades, todo partiendo de una pluralidad de imágenes que son cargadas por el usuario y con un diagnóstico preliminar.

En una modalidad preferida, al comenzar el método de la presente invención el usuario debe seleccionar una variable de optimización general, donde dicha variable presenta dos opciones, las cuales corresponden a realizar optimización para mayor precisión u optimización para mayor velocidad. Esta información es altamente relevante porque en los pasos finales del método, se hará un ordenamiento de los algoritmos dependiendo del tipo de optimización que se desea llevar a cabo, para así poder enviar como resultado al usuario la mejor opción de acuerdo con su selección inicial.

De forma preferida, el conjunto de datos que son enviados por parte del usuario para su procesamiento, son remitidos en formato comprimido, tal como, pero no limitado a .zip, el cual debe incluir un archivo de datos tabulados con los valores separados por comas, tal como un archivo .csv, de diagnósticos dados por el especialista médico y cualquier otra variable que exista del caso y una carpeta relacionada a dicho archivo .CSV con las imágenes diagnósticas para entrenamiento.

Así mismo, preferiblemente, la fragmentación de datos se hace en unos porcentajes específicos, los cuales corresponden, de forma no limitante a 60 a 80%, preferiblemente 70% de datos de entrenamiento, 15 a 20%, preferiblemente 18% de datos de prueba o testeo, y 10 a 15%, preferiblemente 12% de datos de validación. Sin embargo, la presente invención también contempla otros porcentajes de datos dependiendo de la aplicación.

Ahora, el paso de preprocesamiento de los datos cuando éstos han sido fragmentados, puede ser llevado a cabo teniendo como base que con los tres paquetes de datos construidos y de acuerdo a la cantidad de datos, se ejecutan técnicas de aumentación de datos que incluye rotación, cambio de ancho, cambio de altura, giro vertical, giro horizontal, cambio de brillo, cambio de zoom, cortes. Además, posterior y opcional a la aumentación de datos, se pueden ejecutar técnicas de preprocesamiento según el tipo de imágenes médicas, tal como tamaño de imagen, alterar el espacio de color RGB o grises, o agregar un método personalizado de preprocesamiento que recibe una imagen y retorna una imagen preprocesada.

De otra parte, de forma preferida, la lista de valores del paso de generación de parámetros de entrenamiento es tan extensiva como se desee, sin embargo, de forma no limitante, puede incluir los siguientes atributos, los cuales se definen de forma detallada.

• “arquitecturas”: donde cada diccionario se compone del nombre de una arquitectura y un tamaño objetivo para utilizar con cada una. Es posible incluir arquitecturas de fuente abierta o privadas de la compañía.

• “tasa de aprendizaje”: Referencia a la agresividad sobre la que se actualiza cada parámetro de la red en una iteración dada de propagación hacia atrás (“backpropagation” como es conocida comúnmente), valores que se incluyen como referencia: 1 e-2, 1 e-3, 1 e-4, 1 e-5 (es decir, de 1 e- 5 a 1 e-2).

• “funciones de pérdida”: Función/es de pérdida para utilizar.

• “optimizadores”: Incluir un parámetro tipo diccionario donde se relaciona cada posible optimizador con cada posible parámetro que tenga y rangos sobre los que puede variar.

• “pre_top_layer”: Controla la cantidad de neuronas a utilizar en la capa previa a clasificación, se recomienda una variación entre 32 a 128.

• “abandono”: Parámetro que controla cuánta probabilidad de utilizar abandono en las capas de clasificación, y se recomienda una variación entre 0.1 a 0.9.

• “regulariza on”: Controla la cantidad de regulañzación a utilizar en las capas densas en la última fase de la arquitectura (capas de clasificación), se recomienda: “11” o “l_1_2” con posibilidad de 0.001 a 0.1. • “ruta de puntos de control”-. Parámetro interno de implementación que define una ruta de sistema para guardar los algoritmos de control, es decir, los que vayan maximizando la métrica de optimización escogida por el usuario en la etapa a) del presente método.

• “pesos de clase”: Parámetro interno calculado al preparar los datos, le asigna peso a cada clase para equilibrar la función de costo en problemas con clases desbalanceadas.

• “tamaño de lote”: Parámetro interno que controla la cantidad de imágenes que se le muestran a la red por actualización, se recomienda un valor de: 32

• “número de clases”: Parámetro interno calculado al inicio de la fuente de información contando el número de clases para fijar la cantidad de neuronas de salida para la red.

• “multi-etiqueta": Asume valores verdadero o falso dependiendo de si el modelo a entrenar es multi-etiqueta o no según los datos enviados por el usuario.

• “umbral métrico”: Valor interno para hacer evaluaciones con la cohorte de validación, el cual define el umbral sobre el que se considera una predicción como positiva para alguna clase, se recomienda un valor de: 0.5

• “nombre de proyecto”: Valor interno que se asigna al enviar un experimento desde la API.

• “tarea”: Valor interno que puede ser “datos”, “imágenes” o “detección de objeto” dependiendo del caso de predicción enviado por el usuario en la etapa a) del presente método.

• “regresión”: Valor interno que toma valores verdadero o falso dependiendo de si la tarea corresponde a regresión.

• “número de variables”: Valor interno, solo se puede asociar cuándo “tarea” es “datos” y es un conteo del número de variables clínicas a utilizar para entrenamiento. En una modalidad preferida, la creación y optimización de modelos se puede llevar a cabo cargando los parámetros en las arquitecturas seleccionadas, seleccionando un valor único dentro de los rangos en la Etapa e) del presente método, entrenando simultáneamente todas las arquitecturas, haciendo la evaluación usando los datos de validación, y reiterando ese flujo durante cinco intentos de diez épocas cada uno variando cada parámetro. Luego, se procede a seleccionar los mejores parámetros para cada arquitectura bajo cada uno de los posibles optimizadores enviados. Finalmente, utilizando las mejores configuraciones, se procede a entrenar por 35 épocas más, y una vez termine, seleccionar los puntos de control con mejor pérdida en validación para enviar a evaluación final con el conjunto de prueba.

Por último, en una modalidad preferida, el envío de información al usuario, es decir, del algoritmo se hace enviando dicho algoritmo en formato h5 para su descarga y las métricas de desempeño obtenidas en el conjunto de datos de prueba, al tiempo que se envía la información al usuario final por medio del servidor remoto en un llamado a la plataforma de administración que utilizó el usuario inicialmente para crear el algoritmo de la información del entrenamiento.

La anterior descripción define las modalidades preferidas de la invención y se enumera una pluralidad de pasos que permiten llevar a obtener un resultado para el método que se desea proteger. Sin embargo, un experto en la materia entiende y conoce claramente que los pasos anteriormente definidos no están limitados a un orden específico, sino que se pueden llevar a cabo en cualquier orden, dependiendo de su aplicación, donde dicho orden de pasos pretende estar cubierto por el presente documento y se contempla la realización de los pasos del método en cualquier orden deseado.

Aunque la presente invención ha sido definida en términos de las modalidades y/o configuraciones preferidas que permiten obtener el resultado deseado, se entiende entonces que dentro de la presente divulgación se contemplan las múltiples modificaciones y/o alternativas que se puedan derivar de forma evidente para un experto en la materia, razón por la cual el alcance de la presente invención no está definido únicamente por las implementaciones preferidas definidas acá, sino que, por el contrario, el mismo está enteramente definido por las reivindicaciones adjuntas.

Claims

REIVINDICACIONES Un método implementado por computador para el entrenamiento automático de algoritmos para detección temprana de enfermedades mediante imágenes diagnósticas, caracterizado porque comprende los pasos de: a. enviar información desde el usuario a una plataforma remota o servidor, que incluye nombre de identificación del algoritmo a construir, tipo de predicción, columna objetivo de predicción, nombres de otras columnas, métrica estadística de optimización, número de horas de entrenamiento, variable de optimización general, y el conjunto de datos; b. almacenar y clasificar la información recibida del usuario en el servidor y realizar verificación de los datos enviados; c. fragmentar los datos previamente almacenados y clasificados dividiéndolos en datos de entrenamiento, datos de prueba o testeo, y datos de validación; d. preprocesar los datos fragmentados almacenándolos en un paquete de datos con nombres identificables para entrenamiento, prueba y validación; e. generar parámetros de entrenamiento a partir de la información o datos preprocesados seleccionando los parámetros de entrenamiento con base en una lista de valores; f. crear y optimizar modelos a partir de los parámetros de entrenamiento generados, mediante el envío del listado de parámetros e iniciando entrenamiento con los datos de entrenamiento de múltiples modelos en simultáneo, permitiendo almacenar dicho algoritmo en una instancia de modelo, utilizar los datos de testeo para obtener métricas de desempeño sobre dicha instancia de modelo durante esta etapa de entrenamiento e ir descartando los modelos de menor rendimiento; g. evaluar los modelos creados y optimizados una vez creada la instancia de modelo, seleccionando las mejores instancias de modelo que presentan el mejor rendimiento y con base en el conjunto de datos de prueba, determinar las métricas estadísticas de desempeño; h. seleccionar el mejor algoritmo entrenado, ordenando en cierto orden determinado los mejores modelos según la métrica estadística de optimización seleccionada por el usuario; y i. enviar la información final de regreso al usuario con los mejores algoritmos seleccionados, donde dicha información es almacenada y clasificada mostrando los resultados en la plataforma de almacenamiento de datos, enviando el algoritmo seleccionado. El método de acuerdo con la reivindicación 1 , caracterizado porque la variable de optimización general se selecciona de optimización de mayor precisión y optimización de mayor velocidad. El método de acuerdo con la reivindicación 1 , caracterizado porque el conjunto de datos que son enviados por parte del usuario para su procesamiento, son remitidos en un archivo de formato comprimido .zip, que incluye al menos un archivo de datos tabulados con los valores separados por comas .csv. El método de acuerdo con la reivindicación 1 , caracterizado porque en el paso b) si se presenta error en algún dato recibido, se retorna dicho error al usuario, y en caso de éxito se continúa con los pasos posteriores del método y se envía una confirmación de éxito al usuario. El método de acuerdo con la reivindicación 1 , caracterizado porque la fragmentación de datos se realiza en porcentajes definidos, los cuales corresponden a 60 a 80% datos de entrenamiento, 15 a 20% datos de prueba o testeo, y 10 a 15% de datos de validación. El método de acuerdo con la reivindicación 1 , caracterizado porque el paso de preprocesamiento de datos es llevado a cabo con técnicas de aumentación de datos que incluyen rotación, cambio de ancho, cambio de altura, giro vertical, giro horizontal, cambio de brillo, cambio de zoom, cortes, tamaño de imagen, alteración de espacio de color RGB o grises. El método de acuerdo con la reivindicación 1 , caracterizado porque los parámetros de entrenamiento generados incluyen atributos seleccionados del grupo que consiste de arquitecturas, tasa de aprendizaje, funciones de pérdida, optimizadores, cantidad de neuronas a utilizar en la capa previa a clasificación, abandono, regulañzación, ruta de puntos de control, pesos de clase, tamaño de lote, número de clases, multi-etiqueta, umbral métrico, nombre de proyecto, tarea, regresión, y número de variables. El método de acuerdo con la reivindicación 1 , caracterizado porque la creación y optimización de modelos se lleva a cabo cargando los parámetros en las arquitecturas seleccionadas, seleccionando un valor único dentro de los rangos en la Etapa e), entrenando simultáneamente todas las arquitecturas, haciendo la evaluación usando los datos de validación, y reiterando ese flujo durante cinco intentos de diez épocas cada uno variando cada parámetro. El método de acuerdo con la reivindicación 8, caracterizado porque además comprende seleccionar los mejores parámetros para cada arquitectura bajo cada uno de los posibles optimizadores enviados, y seleccionar los puntos de control con mejor pérdida en validación para enviar a evaluación final con el conjunto de prueba. El método de acuerdo con la reivindicación 1 , caracterizado porque el envío de información al usuario del algoritmo se lleva a cabo enviando dicho algoritmo en formato h5.

17