ES2711843A1 - Sistema de evaluacion del comportamiento de web - Google Patents

Sistema de evaluacion del comportamiento de web Download PDF

Info

Publication number
ES2711843A1
ES2711843A1 ES201731290A ES201731290A ES2711843A1 ES 2711843 A1 ES2711843 A1 ES 2711843A1 ES 201731290 A ES201731290 A ES 201731290A ES 201731290 A ES201731290 A ES 201731290A ES 2711843 A1 ES2711843 A1 ES 2711843A1
Authority
ES
Spain
Prior art keywords
time
computer
date
request
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
ES201731290A
Other languages
English (en)
Inventor
Martin Lopez Jose Javier San
Zurdo Jose Javier Sanchez
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universidad Rey Juan Carlos
Original Assignee
Universidad Rey Juan Carlos
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad Rey Juan Carlos filed Critical Universidad Rey Juan Carlos
Priority to ES201731290A priority Critical patent/ES2711843A1/es
Publication of ES2711843A1 publication Critical patent/ES2711843A1/es
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Signal Processing (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Método implementado por ordenador, sistema y producto de programa de ordenador para la evaluación del comportamiento de portales web, cuyo método recupera la información técnica del portal a evaluar y procesa los datos recuperados, de acuerdo a las condiciones definidas previamente en el propio método, considerando además: las temáticas de indicadores a evaluar, los indicadores dentro de cada temática, su ponderación y generando una alarma con el resultado de la evaluación.

Description

DESCRIPCION
SISTEMA DE EVALUACION DEL COMPORTAMIENTO DE WEB
SECTOR DE LA TECNICA
La presente invention se encuadra en el area tecnica de los sistemas que permiten controlar el desempeno de los sitios web. En concreto, la que atane a la generation de alarmas de error, avisos de funcionamiento deficiente y prevision de errores futuros entre otros.
ANTECEDENTES DE LA INVENCION
Actualmente la evaluation de los servicios de paginas web corporativas se orientan fundamentalmente a la consecution de un conjunto bien definido de objetivos; ya sean ventas o intangibles comerciales, tales como los retornos publicos institucionales. Sin embargo, estas estrategias de comunicacion web estan centradas en los intereses del emisor del mensaje, no tanto en los intereses de los receptores de las mismas. Por otro lado, solo parcialmente existen sistemas que permiten controlar y evaluar los sitios web.
Actualmente una empresa o entidad publica orienta sus estrategias de medicion y monitorizacion de sus sistemas desde una perspectiva tecnica. En algunos casos tambien se miden desde una perspectiva de negocio, disponiendo de indicadores que facilitan el seguimiento de los procesos clave y servicios prestados. A nivel de Administration Publica, el Observatorio de Administration Electronica (OBSAE), publica periodicamente indicadores tecnicos y de negocio como, por ejemplo, el numero de transacciones con @firma, numero de facturas electronicas presentadas en FACe, numero de asientos registrales (SIR), autenticaciones via Cl@ve, gasto en TIC, etc. Sin embargo no hay un traslado directo de metricas que esten orientadas al entendimiento de como de eficiente, buena y segura es un sistema para un cliente/ciudadano, usuario de dicho portal de informacion.
Aunque existen avances en esta ilnea por la futura transposition de la Directiva Europea 2016/2012 del Parlamento Europeo y del Consejo que obliga a mejorar la accesibiiidad de los sitios web y aplicaciones moviles en el sector publico, el margen temporal para su implementation es el 21 de junio de 2021 (en varias fases y cumplimientos distintos dependiendo si son portales nuevos, antiguos, aplicaciones de moviles, etc.). Esta Directiva mejorara la accesibilidad de todos los ciudadanos, con especial enfasis en aquellos colectivos con discapacidad permanente o temporal de tipo visual, auditiva, motora, sensorial, etc.
De cara a poder adaptarse a estos cambios, los gestores de los actuales de los sitios web, necesitan conocer no solo datos concretos de funcionamiento o de evaluation por parte de los usuarios, sino tambien datos verificables de rendimiento, problemas del sistema, cumplimiento de normativas, etc. Existe, por tanto, una necesidad no cubierta de un sistema que permita interpretar estos datos y a su vez inferir de ellos posibles problemas futuros aunque sea unicamente a nivel de prediction.
La presente invention propone un procedimiento que evalua la calidad de las paginas web corporativas utilizando metricas e indicadores cuantitativos, capaz de comparar instituciones similares en base a tres criterios fundamentals: calidad de los estandares de publicacion, seguridad de la plataforma utilizada para su distribucion y la disponibilidad de la misma.
Por otro lado, al gestor del sitio web o a la entidad reguladora superior, el procedimiento y sistema descrito en la presente patente le proporciona un conjunto de utilidades capaces de:
• Generar alarmas de mal funcionamiento o detectar problemas basados en datos reales.
• Predecir un posible mal funcionamiento (en base a combination de varios metaindicadores), problemas organizativos, problemas graves de disponibilidad e incluso legales.
• Realizar la combination de las diferentes ponderaciones de los meta-indicadores de acuerdo a la naturaleza del sitio web, por ejemplo un organismo publico o bien una empresa privada. Esto hace que el tratamiento de los casos anteriores sea diferenciado, y lo que es una alarma grave en un caso no lo es en otro tipo de entidad.
La presente invencion ofrece una solucion al problema tecnico del control de sitios web, mediante la generacion de las correspondientes alarmas y senales que detectan los problemas que se estan produciendo e incluso los posibles problemas que pueden suceder en base al conocimiento del valor de los indicadores propuestos.
Los solicitantes de la presente invencion desconocen la existencia de antecedentes que resuelvan de forma satisfactoria la problematica expuesta.
EXPLICACION DE LA INVENCION
El sistema descrito en la presente invencion es un metodo implementado por ordenador y un sistema para la evaluacion del comportamiento de portales web, que realiza a modo de resumen las siguientes tareas:
• recuperar information tecnica del portal web a evaluar;
• procesar los datos recuperados de acuerdo a las condiciones definidas previamente en el propio metodo;
• define las tematicas de los indicadores a evaluar;
• dentro de cada tematica se definen y puntuan los indicadores a evaluar;
• pondera los indicadores seleccionados dentro de cada tematica;
• pondera cada tematica;
• genera informes de resultados para cada tematica
• genera alarmas con el resultado de la evaluacion del portal, incluida una valoracion global: valor CIO-Rank
A la hora de controlar un sitio web, en la presente invencion se ha discriminado tres tipos de indicadores distintos, en base a tres tematicas:
• Seguridad del sistema a analizar.
• Disponibilidad del sistema.
• Posicionamiento de la web a nivel global.
La description de cada uno de estos indicadores es la siguiente:
1.-Seguridad del sistema.
S1. Check certificado HTTPS. Es un indicador que evalua el numero de dlas restantes para que el certificado HTTPS del sitio caduque. La valoracion de este indicador y en su caso penalization no es proporcionalmente lineal al numero de dlas, sino que penaliza exponencialmente la cercanla a la fecha de caducidad.
52. HTTPS-SHAI-test. Valor logico que indica si esta habilitada la funcion resumen SHA1 en el certificado HTTPS. SHA1 es un algoritmo que permite realizar resumenes criptograficos (hash) utilizados en aplicaciones de cifrado y firma. Sin embargo su uso esta totalmente desaconsejado desde el mismo momento que se demuestra que es viable comprometer su seguridad, por lo que utilizarlo puede ser un riesgo.
53. OpenPort-03-Result-Numero Puertos Abiertos. Numero de puertos de comunicacion abiertos en el mismo servidor web, y por tanto, puertas abiertas hacia un numero mayor de posibles vulnerabilidades del sistema. Cuantos menos puertos mejor. Se evalua con el 100% de los puntos de esta metrica si tiene 2 puertos abiertos, siendo la calda proporcional hasta 5 puertos. Mas de 5 puertos abiertos se evaluan con un 0%.
54. SearchEngine-03-Result-Google-Documents and Settings. Documentos publicados con information institucional privada. Numero de documentos indexados en Google que contienen information de usuario o rutas relativas a ordenadores internos. Lo ideal es que no haya ningun documento indexado, asignandose un 100% en el cumplimiento. En caso contrario el valor sera 0%
55. SSLlabs-03-Result-CalificacionCertificado. Calidad del certificado SSL / TLS para el servicio https, en escala de mejor a peor calidad (A-F). Esta calificacion se basa en la gula para clasificar los certificados de servidores de Qualys SSLLab.
56. Tiene Robots.txt. Valor logico que indica si existe el fichero robots.txt. Este fichero indica a los buscadores que indexar y que no, dentro de un sitio web. Es deseable que no haya nada que prohlba a los buscadores que se indexe pues supone una pista a aquellos que buscan explotar informaciones ocultas. Si el valor de este test es 0 significa que obtendra el 100% en el cumplimiento de esta metrica, en caso contrario recibira un 0%.
57. TipoServidorWeb. Informa del tipo de servidor web utilizado, y si es accesible la information, la version correspondiente. En principio no hay preferencias ni calificacion de mejor o peor. Es utilizado como un indicador estadlstico para saber cuantos servidores hay con software comercial u Open Source.
58. WOT_Reputation-03-ChildSafety. Indicador de seguridad infantil. Valor expresado en tanto por ciento, que representa la calidad en los contenidos en relacion a la seguridad aportada a los ninos, siguiendo la clasificacion que ofrece la Web Of Trust (WOT).
59. WOT_Reputation-03-Trustworthiness. Indicador de confianza-reputacion. Porcentaje de calidad en como de seguros y confiables son los contenidos de un sitio segun WOT.
2. -Indicadores de Disponibilidad
A1. Download speed for scenario "WebScenario-Principal". Velocidad media de descarga de la pagina web, expresada en KB/s.
A2. NTP-HTTP. Numero de segundos de diferencia entre la hora oficial espanola y el servidor web. Lo optimo es que esten perfectamente sincronizados. NTP-Network Time Protocol es un protocolo que permite sincronizar la hora de diferentes sistemas. En el caso de Espana, esta hora viene indicada por el Real Observatorio de la Armada.
A3. NumberCloneWebsByDNS. Numero de servidores que gestionan dicha pagina web.
A4. Check DNS Expiration. Numero de dlas para que el dominio DNS del sitio web caduque. Esta metrica se ponderara de la misma manera que el indicador S1, en el que se penaliza de manera exponencial.
A5. Response time for step "DNS-Host" of scenario "WebScenario-Principal". Tiempo de respuesta del servidor. Numero de milisegundos que tarda en cargarse la pagina web principal, siendo deseable por supuesto el menor tiempo posible.
A6. SLA Web. Porcentaje de disponibilidad web. El 100% es el valor optimo, aunque un umbral hasta 99.05% es un resultado razonable, dependiendo de la criticidad de los sistemas y servicios a prestar.
A7. NumberBlackListCheck. Indicador de lista negra. Numero de entradas en las que aparece el dominio o la direccion IP publica de la entidad dentro de los principales servidores que indexan dominios y direcciones IP que generan spam o estan catalogados como peligrosos para la seguridad.
3. -Indicadores del Posicionamiento
SEO1. PageSpeed-Desktop. Puntuacion que permite comparar como de optimizada esta la pagina web para un navegador de escritorio. Este indicador esta basado en los resultados que se obtienen a traves de la plataforma PageSpeed Insights de Google.
SEO2. PageSpeed-Mobile. Este indicador es igual que el anterior pero analizando la pagina web como si estuviera ejecutandose sobre un dispositivo movil o tablet.
SEO3. Rank2Traffic Alexa. Puntuacion que permite comparar la importancia de la web a nivel mundial. Alexa es una empresa que realiza analisis del trafico en la red, estableciendo rankings entre otros, del numero visitas a sitios web, posicionamiento y estrategias SEO.
SEO4. NumberCookies. Numero de cookies que el servidor envla para almacenar informacion de sesion del usuario.
SEO5. SearchEngine-03-Result-Bing. Resultados Bing. Numero de resultados con el nombre de la entidad en una consulta mediante el buscador Bing de Microsoft.
SEO6. SearchEngine-03-Result-Google. Resultados Google. Numero de resultados con el nombre de la entidad en una consulta mediante el buscador de Google.
SEO7. NumberLinks. Numero de enlaces a otras paginas desde la pagina principal de la web a analizar. Es conveniente tener enlaces a otras paginas, pero no un numero excesivo, estableciendose que por encima de 50 enlaces deberla penalizarse en la pagina principal.
La ponderacion de los indicadores, dentro de cada tematica, y de las tematicas, se realiza en funcion de la entidad o grupo de entidades a evaluar. Un grupo de entidades es un conjunto de paginas web que comparten un conjunto de caracterlsticas, objetivos o finalidades comunes, lo que les hace objeto de ser comparadas entre si, por ejemplo, paginas web de ayuntamientos constituirla un grupo de entidades. Estos grupos se pueden definir en base a dos situaciones concretas:
• Que se posea ya conocimiento expllcito de las entidades y las relaciones entre ellas, es decir, que se puedan identificar entidades de manera evidente proporcionando p.ej. un servicio similar o equivalente, lo que les hace ser competidores y tiene sentido realizar una comparativa directa entre ellas.
• Que no se posea de conocimiento expilcito a priori de un conjunto de entidades entre si, de tal manera que se tengan que utilizar tecnicas de clasificacion, prediciendo en base a ios vaiores de ios parametros la clasificacion mas acorde para cada una de las entidades. En este caso serlan de aplicacion sistemas inteligentes de clasificacion, regresiones, utilization de redes neuronales, segmentation en subclases, Support Vector Machines (SVN), Voronoi, etc.
Establecidos los grupos de entidades, en base a caracterlsticas comunes definidas a priori o por extraction de conocimiento via sistemas inteligentes de clasificacion, se puede definir la ponderacion de cada indicador para cada tematica. Los indicadores dentro de una tematica pueden ser ponderados de dos maneras diferentes:
• Inicialmente se puede realizar una ponderacion manual, como p.ej. de manera proporcional (1/X siendo X el numero de indicadores de la tematica). Esta ponderacion puede ser ajustada por el conocimiento de expertos en base a la asignacion de mas importancia de ciertos indicadores para un grupo concreto de paginas webs, pudiendo justificarse que fueran asimetricas por situaciones especiales de cumplimiento legal, impacto e importancia en el grupo de entidades a analizar.
• A partir de metodos estadlsticos concretos o un conjunto de ellos, utilizando un conjunto amplio de muestras para realizar una exploration analltica de los datos. En base a ello se pueden identificar cuanto de importante es cada indicador y se puede aplicar un factor de correccion acorde a las necesidades del analista de datos. A modo de ejemplo, aunque no extensivo, se puede aplicar un analisis PCA (Analisis de Componentes Principales) de tal manera que se puede reducir la dimensionalidad de los indicadores y extraer las correlaciones estadlsticas para aplicar automaticamente la ponderacion segun el Grupo de entidades y para cada una de las tematicas anteriormente mencionadas.
El Procedimiento para la reduction de la dimensionalidad y correlation de indicadores puede ser utilizado para seleccionar la ponderacion de cada indicador dentro de una tematica concreta y grupo de entidades seleccionadas. Para ello se seguirlan los siguientes pasos:
• Se capturarla durante el tiempo suficiente los valores para cada indicador y para cada entidad.
• Si se quiere calcular una ponderacion especlfica para un grupo de entidades, solo se seleccionarlan dichos valores para esas entidades, descartando el resto de entidades. Si se quiere calcular una ponderacion global (que incluyan todas las entidades con independencia de los grupos), no se descartarla ningun dato almacenado en el sistema.
• Se aplica el metodo matematico especlfico, por ejemplo PCA, basandose en los calculos de la matriz de correlation o en calculos de la matriz de covarianzas. • Con los calculos anteriores se puede determinar los valores propios y los vectores propios, utilizandose el par de ellos para determinar la importancia de cada parametro en dicha tematica (pesos)
• Se aplican dichos pesos para cada parametro, realizando una ponderacion para que el resultado de la suma de todos ellos este ajustado entre 0 y 100%.
• Se establece un periodo temporal de validez de estos resultados. Pasado este periodo, se recalcularan los mismos si asl lo estima conveniente el analista de datos.
Conocidos los indicadores y sus tematicas asociadas, grupo al que se aplican y las ponderaciones a aplicar, se definen ponderaciones a aplicar en los resultados para cada tematica. Al igual que en los puntos anteriores, la manera de ponderar una tematica para su evaluation global CIO-Rank podra darse de dos maneras fundamentales:
• Realization de una ponderacion manual para cada una de las Tematicas indicadas, inicialmente de manera proporcional (1/3 del valor para cada Tematica). Sin embargo el analista de datos puede ajustar esta ponderacion en base al conocimiento de las entidades analizadas, grupos concretos de paginas webs o como analisis previo con el cambio sustancial de las ponderaciones de indicadores para extraer conocimiento oculto utilizando tecnicas "What If” o en castellano “Que pasaria si”.
• Tambien se pueden utilizar metodos estadlsticos concretos o un conjunto de ellos, utilizando un conjunto amplio de muestras para realizar una exploration analltica de los datos. En base a ello se pueden identificar cuanto de importante es cada tematica y se puede aplicar un factor de correction acorde a las necesidades del analista de datos. A modo de ejemplo, aunque no extensivo, se puede aplicar un analisis PCA tal como se ha explicado anteriormente.
El metodo para la ponderacion puede ser similar al explicado en el punto anterior referido a los indicadores dentro de una tematica.
De acuerdo a los valores que se obtengan en los indicadores, se genera una alarma cuando se superen los umbrales de seguridad definidos en cada indicador. La captura de la information en la que se basa cada uno de los indicadores referenciados y futuros, se almacenan de manera continua en el sistema. Es el analista de datos el que establece inicialmente un conjunto de umbrales superiores e inferiores que al sobrepasarse desencadenan acciones asociadas. Es viable utilizar mas de dos umbrales, de tal manera que se utilicen tecnicas de definition de funciones definidas a trozos que delimiten claramente donde se establecen cada uno de los umbrales y la criticidad de los mismos.
Una de las alarmas mas significativas es la relacionada con la comprobacion de la hora del servidor, respecto a una referencia dada. En general en Espana se utiliza como referencia la hora proporcionada por el Real Instituto y Observatorio de la Armada, aunque puede utilizarse otra.
Por ello, es posible generar una alarma relacionada con el indicador de disponibilidad A2-NTP-HTTP, que detecta una diferencia entre el reloj interno del ordenador, donde se aloja el portal web, y un reloj de referencia, activandose dicha alarma si es superior a un valor umbra, que puede ser por ejemplo de 60 segundos. La secuencia de operaciones es la siguiente:
• obtener la marca horaria que remite el servidor del portal a analizar;
• obtener la hora de referencia; realizar la petition de hora al Real Instituto y Observatorio de la Armada en San Fernando (ROA). La election de esta entidad es porque es la que establece la hora oficial en Espana. Sin embargo podrla establecerse otra entidad de referencia a solicitud del analista de datos.
• comparan ambas marcas temporales que deben capturarse simultaneamente para poder ser comparables y almacenar la diferencia en el sistema;
• almacenar las diferencias horarias durante el periodo de retention que el analista de datos estime conveniente;
• realizar un estudio de todas las diferencias temporales almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar la discrepancia del tiempo diferencial con el oficial para obtener la valoracion de la metrica, siendo mayor la puntuacion cuanto mas cerca del valor oficial este.
Tambien se puede generar una alarma cuando se detecta un certificado digital con una vigencia inferior a un tiempo predeterminado, como pueden ser 30 dlas, por ejemplo, siendo la secuencia de operaciones, a realizar las siguientes:
• conectarse via protocolo https al servidor del portal a analizar;
• extraer la fecha de validez del certificado del servidor;
• comparar dicha fecha con la fecha actual en el sistema y almacenar la diferencia en el sistema;
• almacenar el dato de la diferencia de fechas, durante el periodo de retencion que el analista de datos estime conveniente;
• realizar un estudio de todas las diferencias temporales almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados (menor 30 dlas);
• ponderar el valor almacenado, siendo mayor la puntuacion cuanto mas tiempo en el futuro tenga validez el certificado.
Otra posible alarma se puede generar cuando se detecta una velocidad de descarga inferior a un valor preestablecido, para cada grupo de entidades, para ello la secuencia de operaciones a realizar serla la siguiente:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular el tamano de la peticion;
• calcular el tiempo empleado en la peticion, como la diferencia entre la marca temporal del fin de la peticion y la marca temporal del inicio de la peticion;
• calcular la velocidad de descarga como el tamano de la peticion dividido entre el tiempo empleado;
• almacenar la velocidad de descarga junto con la fecha en la que se calculo, tomando valor durante el periodo de retencion que el analista de datos estime conveniente;
• realizar un estudio de todas las velocidades de descarga almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar el valor almacenado, siendo mayor la puntuacion cuanto mas velocidad se haya establecido en un momento determinado.
Otra posible alarma se puede generar cuando se detecta que la disponibilidad de una pagina web es inferior al valor preestablecido para cada grupo de entidades, siendo la secuencia de operaciones a realizar la siguiente:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• si la peticion es correcta, se establece ese periodo de tiempo como 100% disponible;
• si la peticion es incorrecta, se establece ese periodo de tiempo como indisponible;
• almacenar las indisponibilidades junto con la fecha en la que se produjo, tomando valor durante el periodo de retention que el analista de datos estime conveniente;
• realizar un estudio de todas las indisponibilidades almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanta mas disponibilidad tenga la entidad.
Otra posible alarma se genera cuando detecta que el numero de cookies de una pagina web es superior al valor preestablecido para cada grupo de entidades, siendo la secuencia de operaciones necesarias para su detection las siguientes:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular las cookies recibidas en la peticion;
• almacenar el numero de cookies junto con la fecha en la que se produjo la conexion, tomando valor durante el periodo de retencion que el analista de datos estime conveniente;
• determinar si se ha superado alguno de los umbrales predeterminados en numero de cookies;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanto menos numero de cookies se hayan detectado.
Otra posible alarma se puede generar cuando se detecta que el numero de enlaces de una pagina web es superior al valor preestablecido para cada grupo de entidades, siendo la secuencia de operaciones:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular el numero de enlaces que la peticion ha devuelto;
• almacenar el numero de enlaces junto con la fecha en la que se produjo la conexion, tomando valor durante el periodo de retention que el analista de datos estime conveniente;
• determinar si se ha superado alguno de los umbrales predeterminados en numero de enlaces;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanto menos numero de enlaces se hayan detectado.
Inicialmente los rangos utilizados en las distintas alarmas parten de un valor estatico, pero puede evolucionar de una manera dinamica, tal que vaya el sistema aprendiendo y detectando dichas alarmas, de acuerdo con el analista de datos y los eventos detectados.
La definition del resto de las alarmas es similar, diferenciandose en el hecho que las desencadena y en el valor del umbral inferior. La superacion de los umbrales puede tener alarmas asociadas. Dichas alarmas pueden ser clasificadas segun las acciones que se asocien:
• Acciones asociadas a la generation de una alarma para poner en conocimiento de la situation acaecida. Esta alarma puede ser entendida de manera amplia, haciendo actuaciones que permitan notificar a las personas indicadas dicha alarma a traves de estlmulos sensoriales humanas (vista, oldo, tacto, gusto u olfato) como otras que esten vinculadas a la automatization de procesos (p.ej.
modificaciones electromagneticas). Aunque de manera preferente suele dotarse de alarmas sonoras, iluminacion de aviso, dispositivos hapticos de notification (p.ej. dispositivos con retroalimentacion haptica), pero podrla extenderse con dispositivos que cambian el entorno a nivel olfativo. A modo de ejemplo podrlan ser alarmas dentro de estos ambitos la remision de correos electronicos de alarma, remision de mensajes via SMS a dispositivos moviles, mensajes por mensajerla instantanea, remision de information de alerta a redes sociales tipo Facebook/Twitter/Instagram, entre otros.
• Acciones asociadas a la correction del propio evento en si, de tal manera que se permita ejecutar acciones que corrijan o al menos mitiguen el propio evento de alerta en si. A modo de ejemplo aunque no extensivo, se puede indicar que al superar el umbral inferior de validez de un dominio de Internet se realicen las acciones pertinentes para solicitar la renovation automatica del dominio DNS.
Debido a la gran cantidad de datos que se iran almacenando de todos los indicadores, se podra realizar un analisis estadlstico para determinar los automatismos para el ajuste de los umbrales anteriormente indicados. Tecnicas de segmentation, redes neuronales, clustering, etc pueden determinar un ajuste mas fino de las alarmas segun la Tematica y el grupo a analizar.
La recuperation de los parametros del servidor y su evaluation se realiza en tiempo real. No obstante, la captura de los resultados de cada indicador, en algunos casos es puntual a lo largo del dla y en otras es periodicamente (como por ejemplo el calculo de la disponibilidad web que es cada 2 minutos comprobando la conexion). Por tanto, si bien la recuperacion es en tiempo real, la evaluacion depende directamente del algoritmo matematico que a usar.
Las alarmas descritas pretenden dar una perspectiva de las multiples posibilidades que ofrece la presente invention, siendo su esplritu mas amplio al englobar muchos otros posibles indicadores y combinaciones de indicadores para obtener nuevas conclusiones. Hay que tener en cuenta que pueden ir apareciendo test de seguridad que ahora son errores ocultos y que podran ponderarse tras su descubrimiento, e integrarse en las tematicas descritas o en otras similares.
BREVE DESCRIPCION DE LOS DIBUJOS
Para complementar la description que se esta realizando y con objeto de ayudar a una mejor comprension de las caracteristicas de la invention, se acompana como parte integrante de dicha description, un dibujo en donde con caracter ilustrativo y no limitativo, se ha representado lo siguiente:
La figura 1: Description esquematica del procedimiento descrito donde puede apreciarse primeramente como se accede a datos publicos de los diferentes sitios web (1) a evaluar, siendo recogido en el servidor del sistema (2) para su tratamiento. De acuerdo a cada una de las Tematicas (3) que pueden evaluarse, en cada caso se determinan los valores obtenidos en cada Indicador (4) y el valor ponderador (5) en cada caso. Resultado de la interaction de cada uno de los anteriores en cada tematica concreta, resulta en la obtencion de una Puntuacion (6) por tematica. La combination de las diferentes puntuaciones (6) determina el Indicador global CIO-Rank (7) y la generation de los informes y alarmas (8) adecuados en cada caso.
REALIZACION PREFERENTE DE LA INVENCION
La generation de una alarma viene determinada fundamentalmente por cambios inesperados de un indicador de los definidos en la presente patente con respecto a un umbral de referencia. Los umbrales se definen para cada indicador concreto. Para un indicador normalmente se puede establecer un valor o rango de referencia, donde el comportamiento se puede considerar normal. Si dicho comportamiento se desvia de los parametros de normalidad, entonces pueden suceder dos opciones (en el caso mas simple):
• Que el valor actual sea superior el rango de referencia. En este caso se puede establecer una alarma que alerte de niveles superiores al indicado.
• Que el valor actual sea inferior al rango de referencia. En este caso se puede establecer otra alarma que alerte de niveles inferiores a lo que se esperaba.
Este seria el caso de generation de dos alarmas vinculadas a un indicador, pero se pueden definir mas alarmas, de tal manera que se puedan establecer multiples rangos de superacion de la normalidad, con comportamientos distintos para cada una de ellas. A efectos comparativos es similar a crear una funcion matematica definida a trozos, donde cada salto de la funcion a representar estaria representado por el rango de cada subfuncion y su alarma correspondiente. Esto no limitarfa el numero de alarmas a definir dentro de una metrica o indicador.
En el sistema descrito se identifican alarmas analizando el valor anterior con respecto al valor actual. Si el comportamiento se considera que no esta dentro de la normalidad del indicador/metrica, el sistema desencadena el aviso de la situation (por diferentes canales de comunicacion, como email, SMS, mensajeria instantanea, etc...) y, si es deseable, un comportamiento adicional vinculado a acciones correctivas.
A continuation se describe un ejemplo completo de evaluation, con independencia de las metricas que se capturen:
1. Se carga en el sistema la direction web del sistema a analizar. Esta carga fundamentalmente requiere la determination de datos identificativos de la entidad, datos de contacto y datos de servidores que estan expuestos al publico, para su analisis.
2. Tras la carga de los datos en el sistema, se selecciona que grupo de entidades es el que le representa mejor, si fuera conocido. Si no lo fuese, se asigna a un grupo general para que comience la captura de la information de cada indicador.
3. Cada indicador se actualiza una vez al dla (o varias veces si fuera necesario por la propia necesidad de la metrica, como por ejemplo la disponibilidad web). La actualizacion se realiza a traves de scripts que realizan fundamentalmente cuatro tareas:
• Conexion al servidor destino.
• Extraction de la informacion
• Tratamiento de la informacion
• Almacenamiento de los resultados en la plataforma
4. Tras el almacenamiento de los resultados obtenidos, automaticamente se realizan los calculos de deteccion de situaciones anomalas. Estas situaciones anomalas estan preestablecidas en los propios indicadores a traves de disparadores, que detectan los eventos de superacion de umbrales. En tales casos, se ejecutan tareas para:
• Notificar mediante las alarmas preestablecidas de la situacion encontrada.
• Automatization de las tareas que restauran la situacion a la normalidad. En estos casos es necesaria conectividad y acceso a los sistemas finales para poder establecer y ejecutar dichas tareas, o en su defecto, disponer de un frontal de comunicacion que permita notificarlo y ejecutar dichas acciones en remoto.
5. Tras la acumulacion de resultados y segun establezca el analista de datos, se exportara todas las metricas e indicadores, pudiendo ejecutar dichos resultados con programas de analisis estadlstico, programas de inteligencia artificial o similares.
6. Tras el analisis de las metricas a traves de los diferentes algoritmos que determine el analista de datos, se importaran los resultados en la plataforma, de tal manera que se puedan disponer los valores obtenidos por cada Tematica en dicha entidad analizada. Con los resultados globales por cada Tematica, se obtiene el metaindicador CIO-Rank que consolida los resultados de cada Tematica y que sirve como referencia sencilla para los usuarios sin conocimientos tecnicos.
7. Con todos los resultados ya calculados, se realiza un informe de la situacion de la entidad en base a los resultados obtenidos, siendo el analista de datos el que proporcione explication de lo obtenido y pudiendo indicar las acciones presentes y futuras para la mejora de los resultados.

Claims (16)

REIVINDICACIONES
1. - Metodo implementado por ordenador para la evaluation del comportamiento de portales web, comprendiendo el metodo:
• recuperar information tecnica del portal a evaluar;
• procesar de los datos recuperados de acuerdo a las condiciones definidas previamente en el propio metodo;
caracterizado porque el metodo comprende ademas la:
• caracterizacion de las tematicas de indicadores a evaluar;
• caracterizacion de los indicadores a evaluar dentro de cada tematica;
• ponderacion de los indicadores seleccionados dentro de cada tematica;
• ponderacion de cada tematica;
• generation de alarmas con el resultado de la evaluation global del portal.
2. - Metodo implementado por ordenador, segun la revindication 1, caracterizado porque comprende, al menos, una tematica relacionada con la seguridad del portal, una tematica con la disponibilidad del portal y una tematica del posicionamiento del portal.
3. - Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque dentro de la tematica de seguridad del portal incluye al menos alguno de los siguientes indicadores:
• certificados HTTPS;
• HTTPS-SHA1;
• numero de puertos abiertos;
• Documentos publicados con information institucional privada
• calificacion de certificados SSLlabs;
• analisis de robots;
• tipo de servidor;
• seguridad infantil e
• indicador de confianza.
4.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque dentro de la tematica de disponibilidad del portal incluye al menos alguno de los siguientes indicadores:
• velocidad de descarga;
• reloj (NTP-HTTP);
• numero de clones web por DNS;
• finalizacion de la reserva del dominio DNS;
• tiempo de respuesta del servidor
• SLA web
• indicador de lista negra.
5.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque dentro de la tematica de posicionamiento del portal incluye al menos alguno de los siguientes indicadores:
• velocidad de paginado - ordenadores;
• velocidad de paginado - dispositivos moviles;
• ranking trafico de Alexa;
• numero de cookies;
• resultado del buscador Bing;
• resultado del buscador Google y
• numero de links.
6. - Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque la ponderacion de los indicadores, dentro de cada tematica, y de las tematicas, se realiza en funcion de la entidad o grupo de entidades a evaluar.
7. - Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque se genera una alarma cuando un indicador de los definidos anteriormente tiene un cambio inesperado respecto a un umbral de referencia.
8. - Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta una diferencia entre el reloj interno del ordenador, donde se aloja el portal web, y un reloj de referenda superior a un umbral determinado, de acuerdo con la secuencia de operaciones que comprende:
• obtener la marca horaria que remite el servidor del portal a analizar;
• obtener la hora de referencia;
• comparar ambas marcas temporales y almacenar la diferencia en el sistema; • almacenar las diferencias horarias durante el periodo de retencion que el analista de datos estime conveniente;
• realizar un estudio de todas las diferencias temporales almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar la discrepancia del tiempo diferencial con el oficial para obtener la valoracion de la metrica, siendo mayor la puntuacion cuanto mas cerca del valor oficial este.
9.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta un certificado digital con una vigencia inferior a tiempo establecido, de acuerdo con la secuencia de operaciones que comprende:
• conectase via protocolo https al servidor del portal a analizar;
• extraer la fecha de validez del certificado del servidor;
• comparar dicha fecha con la fecha actual en el sistema y almacena la diferencia en el sistema;
• almacenar la diferencia de fechas durante el periodo de retencion que el analista de datos estime conveniente;
• realizar un estudio de todas las diferencias temporales almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar el valor almacenado, siendo mayor la puntuacion cuanto mas tiempo en el futuro tenga validez el certificado.
10.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta una velocidad de descarga inferior al preestablecido para cada grupo de entidades, de acuerdo con la secuencia de operaciones que comprende:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular el tamano de la peticion;
• calcular el tiempo empleado en la peticion como la diferencia entre la marca temporal del fin de la peticion y la marca temporal del inicio de la peticion;
• calcular la velocidad de descarga como el tamano de la peticion dividido entre el tiempo empleado;
• almacenar la velocidad de descarga junto con la fecha en la que se calculo, tomando valor durante el periodo de retention que el analista de datos estime conveniente;
• realizar un estudio de todas las velocidades de descarga almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar el valor almacenado, siendo mayor la puntuacion cuanto mas velocidad se haya establecido en un momento determinado.
11.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta que la disponibilidad de una pagina web es inferior al valor preestablecido para cada grupo de entidades, de acuerdo con la secuencia de operaciones que comprende:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• si la peticion es correcta, establecer ese periodo de tiempo como disponible;
• si la peticion es incorrecta, establecer ese periodo de tiempo como indisponible; • almacenar las indisponibilidades junto con la fecha en la que se produjo, tomando valor durante el periodo de retencion que el analista de datos estime conveniente;
• realizar un estudio de todas las indisponibilidades almacenadas para esa entidad y pagina web;
• determinar si se ha superado alguno de los umbrales predeterminados;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanto mas disponibilidad tenga la entidad.
12.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta que el numero de cookies de una pagina web es superior al valor preestablecido para cada grupo de entidades, de acuerdo con la secuencia de operaciones que comprende:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular las cookies recibidas en la peticion;
• almacenar el numero de cookies junto con la fecha en la que se produjo la conexion, tomando valor durante el periodo de retention que el analista de datos estime conveniente;
• determinar si se ha superado alguno de los umbrales predeterminados en numero de cookies;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanto menos numero de cookies se hayan detectado.
13.- Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque el sistema genera una alarma cuando detecta que el numero de enlaces de una pagina web es superior al valor preestablecido para cada grupo de entidades, de acuerdo con la secuencia de operaciones que comprende:
• guardar como marca temporal la fecha y hora del inicio de la peticion;
• realizar la conexion a la pagina web, descargando el contenido;
• guardar como marca temporal la fecha y hora del fin de la peticion;
• calcular el numero de enlaces que la peticion ha devuelto;
• almacenar el numero de enlaces junto con la fecha en la que se produjo la conexion, tomando valor durante el periodo de retencion que el analista de datos estime conveniente;
• determinar si se ha superado alguno de los umbrales predeterminados en numero de enlaces;
• ponderar los valores almacenados, siendo mayor la puntuacion cuanto menos numero de enlaces se hayan detectado.
14. - Metodo implementado por ordenador, segun cualquiera de las reivindicaciones anteriores, caracterizado porque la recuperacion de los parametros del servidor se realiza en tiempo real y su evaluacion se realiza en tiempo real o periodicamente dependiendo de la naturaleza del indicador.
15. - Sistema para la evaluacion del comportamiento de portales web, comprendiendo el sistema:
• medios de recuperacion y almacenamiento la information tecnica del portal a evaluar;
• medios de procesar de los datos recuperados de acuerdo a las condiciones definidas previamente en el propio metodo
caracterizado porque los medios de procesamiento de datos se configuran ademas para:
• caracterizar las tematicas de indicadores a evaluar;
• caracterizar los indicadores a evaluar dentro de cada tematica;
• ponderar los indicadores seleccionados dentro de cada tematica;
• ponderar cada tematica;
• generar alarmas con el resultado de la evaluacion global del portal.
16.- Producto de programa de ordenador para la evaluacion del comportamiento de portales web, caracterizado porque comprende un codigo de programa que puede usarse en un ordenador para realizar las etapas del metodo implementado por ordenador definido en cualquiera de las reivindicaciones 1 a 13.
ES201731290A 2017-11-03 2017-11-03 Sistema de evaluacion del comportamiento de web Withdrawn ES2711843A1 (es)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ES201731290A ES2711843A1 (es) 2017-11-03 2017-11-03 Sistema de evaluacion del comportamiento de web

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES201731290A ES2711843A1 (es) 2017-11-03 2017-11-03 Sistema de evaluacion del comportamiento de web

Publications (1)

Publication Number Publication Date
ES2711843A1 true ES2711843A1 (es) 2019-05-07

Family

ID=66314347

Family Applications (1)

Application Number Title Priority Date Filing Date
ES201731290A Withdrawn ES2711843A1 (es) 2017-11-03 2017-11-03 Sistema de evaluacion del comportamiento de web

Country Status (1)

Country Link
ES (1) ES2711843A1 (es)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671757B1 (en) * 2000-01-26 2003-12-30 Fusionone, Inc. Data transfer and synchronization system
US20050262240A1 (en) * 2004-05-24 2005-11-24 Drees Timothy P System and method for correlation and analysis of website performance, traffic, and health data
US20080270209A1 (en) * 2007-04-25 2008-10-30 Michael Jon Mauseth Merchant scoring system and transactional database
US20110270965A1 (en) * 2010-04-29 2011-11-03 Yahoo! Inc. Methods for Web Site Analysis
US20120254405A1 (en) * 2011-03-31 2012-10-04 Infosys Technologies Limited System and method for benchmarking web accessibility features in websites
US20130132213A1 (en) * 2011-11-01 2013-05-23 Bing Liu Method and system for providing price comparisons and alerts
US20150039746A1 (en) * 2013-07-30 2015-02-05 Go Daddy Operating Company, LLC Methods and systems for improving website performance
US20170099319A1 (en) * 2015-09-16 2017-04-06 RiskIQ, Inc. Identifying phishing websites using dom characteristics

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671757B1 (en) * 2000-01-26 2003-12-30 Fusionone, Inc. Data transfer and synchronization system
US20050262240A1 (en) * 2004-05-24 2005-11-24 Drees Timothy P System and method for correlation and analysis of website performance, traffic, and health data
US20080270209A1 (en) * 2007-04-25 2008-10-30 Michael Jon Mauseth Merchant scoring system and transactional database
US20110270965A1 (en) * 2010-04-29 2011-11-03 Yahoo! Inc. Methods for Web Site Analysis
US20120254405A1 (en) * 2011-03-31 2012-10-04 Infosys Technologies Limited System and method for benchmarking web accessibility features in websites
US20130132213A1 (en) * 2011-11-01 2013-05-23 Bing Liu Method and system for providing price comparisons and alerts
US20150039746A1 (en) * 2013-07-30 2015-02-05 Go Daddy Operating Company, LLC Methods and systems for improving website performance
US20170099319A1 (en) * 2015-09-16 2017-04-06 RiskIQ, Inc. Identifying phishing websites using dom characteristics

Similar Documents

Publication Publication Date Title
US11265344B2 (en) Remedial actions based on user risk assessments
CN108780475B (zh) 用于虚拟辅助的个性化推论认证
US20230030943A1 (en) Machine Learning-Based Platform For User Identification
GB2609828A (en) Network security
US10313364B2 (en) Adaptive client-aware session security
Pham et al. Phishing-aware: A neuro-fuzzy approach for anti-phishing on fog networks
US10193699B2 (en) Probabilistic classifiers for certificates
US20240015173A1 (en) Techniques for clickstream tracking across browser tabs
US11074476B2 (en) Data ingestion platform
BR112012018643A2 (pt) método em um sistema de segurança de rede para detecção de acessos não-autorizados, sistema de segurança de rede e produto de programa de computador
CN104429110A (zh) 尤其涉及计算资源和/或基于移动装置的可信计算的方法、一个或多个计算机可读非临时性存储介质及装置
US20190222586A1 (en) Method and system of decentralized malware identification
WO2021160929A1 (en) System and method for improving cybersecurity
Ghenai Health misinformation in search and social media
CN110417718A (zh) 处理网站中的风险数据的方法、装置、设备及存储介质
US20140304786A1 (en) Resilient and restorable dynamic device identification
Hernández-Álvarez et al. SmartCAMPP-Smartphone-based continuous authentication leveraging motion sensors with privacy preservation
Bakar et al. Adaptive authentication based on analysis of user behavior
BR102018009944A2 (pt) método para detectar aplicativos de terminais de usuário móveis
ES2711843A1 (es) Sistema de evaluacion del comportamiento de web
Vecchiato et al. A security configuration assessment for android devices
Pilania et al. Digitization Through SNS: Issues, Challenges, and Recommendations—A Case Study
Alohali et al. The design and evaluation of a user-centric information security risk assessment and response framework
US10798129B2 (en) Constraint-based multiuse certificates
Simoiu Secure by default: a behavioral approach to cyber security

Legal Events

Date Code Title Description
BA2A Patent application published

Ref document number: 2711843

Country of ref document: ES

Kind code of ref document: A1

Effective date: 20190507

FA2A Application withdrawn

Effective date: 20190924