ES2908284T3 - Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo - Google Patents

Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo Download PDF

Info

Publication number
ES2908284T3
ES2908284T3 ES18175372T ES18175372T ES2908284T3 ES 2908284 T3 ES2908284 T3 ES 2908284T3 ES 18175372 T ES18175372 T ES 18175372T ES 18175372 T ES18175372 T ES 18175372T ES 2908284 T3 ES2908284 T3 ES 2908284T3
Authority
ES
Spain
Prior art keywords
identification
recording
user
unique
videos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18175372T
Other languages
English (en)
Inventor
Benny Bennet Jürgens
Fabian Kohn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nect GmbH
Original Assignee
Nect GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nect GmbH filed Critical Nect GmbH
Application granted granted Critical
Publication of ES2908284T3 publication Critical patent/ES2908284T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2103Challenge-response

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

Método para validar la identificación de un usuario por grabación de vídeo en vivo a distancia, en el que en un sistema (10) que comprende al menos un dispositivo de grabación (30) equipado para grabar un vídeo, se llevan a cabo sucesivamente los siguientes pasos: a) el dispositivo de grabación (30) graba (54, 64, 66) dos o más vídeos de identificación con marca de agua que capturan rasgos biométricos del usuario y un documento de identificación personal del usuario en el que se incluye al menos una comprobación de vida relacionada con el usuario, en el que los dos o más vídeos de identificación tienen marca de agua, en el que durante la grabación de los vídeos de identificación el dispositivo de grabación (30) genera señales físicas de marca de agua de acuerdo con una especificación de marca de agua única o casi única, donde las señales físicas de marca de agua entran en la pista de audio y/o en la pista de vídeo mediante oscilaciones físicas generadas por un dispositivo de altavoz (36) del dispositivo de grabación (30) y/o un dispositivo de vibración (40) del dispositivo de grabación (30) y grabadas por un micrófono (38), una cámara (34) y/o un acelerómetro (42) del dispositivo de grabación (30), en el que se graban al menos dos vídeos de identificación separados (64, 66) con al menos un vídeo de identificación biométrica que captura las características biométricas del usuario y al menos un vídeo de identificación de documentos separado que captura el documento de identificación personal del usuario, en el que los al menos dos vídeos de identificación separados llevan una marca de agua utilizando diferentes especificaciones de marca de agua únicas o casi únicas, b) los vídeos de identificación con marca de agua grabados son analizados por una unidad de análisis del dispositivo de grabación (30) o de un dispositivo servidor (20) durante la grabación de los vídeos de identificación con marca de agua o tras finalizar la grabación de los vídeos de identificación con marca de agua, y c) la unidad de análisis analiza (56, 68) los vídeos de identificación con marca de agua en busca de información de identificación del usuario y en busca de la presencia de señales de marca de agua de acuerdo con las especificaciones de marca de agua únicas o casi únicas, donde el vídeo de identificación biométrica y el vídeo de identificación de documentos se comparan entre sí con respecto a una similitud de parámetros de grabación y/o entornos.

Description

DESCRIPCIÓN
Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo
La invención se refiere a un método para validar la identificación remota de un usuario mediante grabación de vídeo en vivo, realizado en un sistema que comprende al menos un dispositivo servidor y un dispositivo de grabación equipado para grabar un vídeo conectado o conectable a dicho dispositivo servidor. La invención se refiere además a un sistema para validar la identificación remota de grabación de vídeo en vivo de un usuario, comprendiendo el sistema al menos un dispositivo servidor y al menos un dispositivo de grabación conectado o conectable remotamente al al menos un dispositivo servidor, en el que el dispositivo de grabación comprende una cámara y un micrófono y está equipado para grabar vídeos con la cámara y el micrófono, en el que el dispositivo de grabación comprende además al menos uno de un dispositivo de altavoz y un dispositivo de vibración.
Hay muchos escenarios en los que una persona necesita llevar a cabo una identificación, incluyendo, pero sin limitación, los procesos de Conozca a su cliente (CSC), en los que la identidad de un usuario o cliente tiene que ser verificada como parte de un procedimiento de registro, por ejemplo, cuando se crea una cuenta bancaria, se suscribe a una póliza de seguro, se registra para una oferta inicial de monedas (OIM) en el contexto de las criptodivisas y los tokens.
Una posible forma de identificación del usuario es la identificación remota a través de un canal digital, como los métodos de identificación por vídeo (videoidentificación), en los que un operador identifica a un cliente en el contexto de una conversación por cámara web. Estos métodos de identificación por vídeo son más convenientes y consumen menos tiempo que, por ejemplo, los métodos de identificación postal, en los que el personal de un servicio postal identifica a un cliente que se encuentra frente a ellos en persona con la ayuda de un documento de identificación. Los problemas de calidad en los sistemas de identificación por vídeo causados por el comportamiento humano y los desafíos tecnológicos, tales como los desafíos inherentes a la transmisión de datos en vivo en canales de audio y vídeo en contraposición con el uso de vídeos grabados, requieren un método y un sistema de identificación por vídeo mejorado que pueda ser procesado a través de un canal digital, pero utilizando una evaluación asíncrona y automatizada. Dicha evaluación asíncrona y la simple transferencia de grabaciones de vídeo en un formato predefinido y unificado, respectivamente, ayudarían a superar los retos técnicos de una emisión en vivo, como un ancho de banda suficiente y estable, así como los cambios en las variables ambientales.
Para que una unidad de evaluación, que puede estar en una ubicación remota, pueda realizar esta evaluación asíncrona, debe garantizarse que sea posible comprobar que la grabación no ha sido falsificada o manipulada y que no ha sido utilizada anteriormente. Ya no es posible comprobar si la persona que se va a identificar actúa en vivo reaccionando de forma individual y espontánea, ya que la grabación no es una transmisión en vivo. Además, hay que asegurarse de que la persona que aparece en la transmisión de vídeo es una persona viva y no una fotografía de una persona.
Como en todos los sistemas de seguridad, es conveniente mejorar el sistema y el método incorporando múltiples factores. Preferiblemente, el método debería incluir factores que puedan ser añadidos sin acciones por parte de un usuario, para que éste pueda concentrarse en los factores de seguridad basados en el usuario. Al usuario no deben imponérsele demasiadas tareas, por lo que un factor de máquina o de fondo es beneficioso. Dicho factor de máquina también puede ser conveniente, si un usuario no es capaz de proporcionar el primer factor, por ejemplo, debido a discapacidades corporales, o porque el nivel de seguridad de un factor es suficiente y al usuario se le debe imponer las menos cargas posibles.
Dichos factores de máquina o factores de fondo pueden pensarse en términos de marca de agua, por ejemplo, mediante el uso de sonidos audibles o inaudibles, que pueden añadirse a la pista de audio de una grabación de vídeo, ya sea digitalmente o reproduciendo los sonidos durante la grabación, como se describe en US 2017/0220786 A1.
US 2015/0254443 A1 describe un método para la autenticación biométrica de un usuario mediante un procedimiento de desafío/respuesta con una estación móvil que incluye la autenticación del usuario inscrito antes de realizar una transacción. Se establece un canal de comunicación entre la estación móvil y un servidor de autenticación y se envía un desafío del servidor de autenticación a la estación móvil. Una secuencia de respuesta expresada por el usuario se graba simultáneamente con las señales ambientales o una respuesta del ambiente. La secuencia de respuesta grabada y las señales ambientales grabadas se envían al servidor de autenticación y se evalúan en función de los datos biométricos recuperados de la base de datos. Se verifica si el usuario se corresponde con el usuario registrado. Se evalúan las señales ambientales y los cambios de señal identificados dentro de las señales ambientales, y se determina si los cambios de señal identificados representan una secuencia lógica de eventos en las proximidades del usuario.
En WO 2015/163774 A1 se describe un sistema basado en audio que incluye un procesador que incluye una lógica de marca de agua para emitir una primera marca de agua a un dispositivo de salida que emite una primera señal de marca de agua, basada en la primera marca de agua, a un medio de transmisión acústica. El procesador también incluye una lógica de grabación para capturar, en un primer período de tiempo, una presentación de autenticación que comprende la primera señal de marca de agua convolucionada, a través del medio de transmisión acústico, con una primera señal de frase de paso.
Un objeto de la presente invención es proporcionar un método y un sistema para validar la identificación remota de grabación de vídeo en vivo de un usuario con una seguridad de validación mejorada.
Este objeto se consigue mediante un método para validar la identificación por grabación remota de vídeo en vivo de un usuario, en el que, en un sistema que comprende al menos un dispositivo de grabación equipado para grabar un vídeo, se llevan a cabo sucesivamente los siguientes pasos:
a) el dispositivo de grabación graba dos o más vídeos de identificación con marca de agua que capturan características biométricas del usuario y un documento de identificación personal del usuario que incluye al menos una comprobación de vida relacionada con el usuario, en el que los dos o más vídeos de identificación tienen marcas de agua, en el que, durante la grabación de los vídeos de identificación, el dispositivo de grabación genera señales físicas de marca de agua de acuerdo con una especificación de marca de agua única o casi única, en el que las señales físicas de marca de agua entran en la pista de audio y/o en la pista de vídeo por medio de oscilaciones físicas generadas por un dispositivo de altavoz del dispositivo de grabación y/o un dispositivo de vibración del dispositivo de grabación y registradas por un micrófono, una cámara y/o un acelerómetro del dispositivo de grabación, en los que se graban al menos dos vídeos de identificación separados con al menos un vídeo de identificación biométrica que captura las características biométricas del usuario y al menos un vídeo de identificación de documentos separado que captura el documento de identificación personal del usuario, en el que los al menos dos vídeos de identificación separados llevan marcas de agua utilizando diferentes especificaciones de marca de agua únicas o casi únicas,
b) los vídeos de identificación con marca de agua grabados son analizados por una unidad de análisis del dispositivo de grabación o de un dispositivo servidor durante la grabación de los vídeos de identificación con marca de agua o tras finalizar la grabación de los vídeos de identificación con marca de agua, y
c) la unidad de análisis analiza los vídeos de identificación con marca de agua en busca de información de identificación del usuario y de la presencia de señales de marca de agua de acuerdo con las especificaciones de marca de agua únicas o casi únicas,
en el que el vídeo de identificación biométrica y el vídeo de identificación de documentos se comparan entre sí con respecto a una similitud de parámetros de grabación y/o entornos.
La presente invención se basa en la idea básica de que, independientemente del caso de uso, la identificación puede llevarse a cabo mediante un proceso automatizado o semiautomatizado, en el que se requiere que la persona que se va a identificar envíe algún tipo de grabación de vídeo de un documento de identificación y datos biométricos del propio usuario utilizando un dispositivo de grabación, como un teléfono inteligente, a un dispositivo servidor. Un concepto de marca de agua se combina con una comprobación de vida relacionada con el usuario para validar el tiempo real y/o la viveza de la grabación del vídeo. Para ello, se combinan o conviven varias características con el vídeo grabado sobre las que el usuario no tiene control directo, como frecuencias de sonido elegidas de forma aleatoria o determinista superpuestas durante la grabación (mediante su reproducción y grabación en el dispositivo de grabación), señales de vibración aleatorias inducidas en el dispositivo de grabación, detectadas mediante un micrófono, un acelerómetro o incluso fluctuaciones visuales en el vídeo grabado.
En el contexto de la presente solicitud, una especificación de marca de agua única es una especificación de marca de agua que es única para un solo caso de uso, mientras que una especificación de marca de agua cuasi-única puede ser elegida o generada a partir de un conjunto limitado de especificaciones de marca de agua, siendo el conjunto lo suficientemente grande como para hacer improbable una repetición accidental de la misma especificación de marca de agua. Dependiendo del uso previsto o de la frecuencia de uso, el conjunto puede contener docenas, cientos, miles o más de tales especificaciones predeterminadas.
Estas especificaciones de marca de agua, únicas o casi únicas, suelen ser generadas o seleccionadas por el dispositivo servidor y validadas, preferiblemente por la misma entidad, en los datos de vídeo grabados con marca de agua para garantizar que la información grabada no ha sido manipulada de ninguna manera y que la grabación se realizó en el momento de la identificación, es decir, que no se utilizó material pregrabado.
La combinación de las comprobaciones de vida relacionadas con el usuario y la marca de agua física de los vídeos de identificación hace que la identificación sea altamente resistente a las manipulaciones y, por tanto, fiable.
En las realizaciones del método, el sistema comprende además un dispositivo servidor, al que el dispositivo de grabación está conectado o puede conectarse, en el que el usuario inicializa una solicitud de identificación en el dispositivo de grabación, el dispositivo de grabación solicita una especificación de marca de agua única a un dispositivo servidor, y el dispositivo servidor selecciona o genera una especificación de marca de agua única o casi única y proporciona la especificación de marca de agua única o casi única al dispositivo de grabación.
En una realización, el dispositivo servidor es físicamente distinto del dispositivo de grabación, y el dispositivo servidor y el dispositivo remoto están conectados o pueden conectarse remotamente. En una realización alternativa, el dispositivo servidor puede estar ubicado en el dispositivo de grabación. Este puede ser el caso, si el dispositivo de grabación es, por ejemplo, un teléfono inteligente con todos los componentes necesarios, en el que el dispositivo de grabación y el dispositivo servidor se ejecutan como aplicaciones separadas en el mismo dispositivo.
En realizaciones, el dispositivo de grabación puede ser, a modo de ejemplo no limitativo, un teléfono inteligente, una tableta o un ordenador portátil con una cámara y un dispositivo de reproducción y un dispositivo de grabación, o un dispositivo de captura de vídeo dedicado. El dispositivo de grabación está configurado mediante un software, en particular un programa ejecutable o una aplicación que se ejecuta en el dispositivo de grabación, para llevar a cabo los pasos del proceso asignados al dispositivo de grabación. Del mismo modo, el dispositivo servidor está configurado por medio de un software que se ejecuta en el dispositivo servidor para realizar los pasos del proceso asignados al dispositivo servidor.
De acuerdo con la presente invención, se graban al menos dos vídeos de identificación separados con al menos un vídeo de identificación biométrica que captura las características biométricas del usuario y al menos un vídeo de identificación de documento separado que captura el documento de identificación personal del usuario, en el que los al menos dos vídeos de identificación separados llevan una marca de agua utilizando una especificación de marca de agua única o casi única diferente. Esta separación de la grabación simplificará el análisis de los vídeos para realizar la identificación de los datos biométricos en un vídeo y las características del documento de identificación en el otro vídeo.
En realizaciones, la especificación de marca de agua única o casi única es un archivo de sonido de marca de agua que se reproducirá al menos una vez por el dispositivo de grabación al principio de la grabación y/o una o más veces especificadas después del principio de la grabación, o la especificación de marca de agua única o casi única es un archivo de datos de marca de agua que contiene la especificación de una serie no aleatoria o aleatoria de una o más frecuencias de sonido y/o señales de vibración, incluyendo en particular información de temporización, contando la información de temporización en particular desde el momento del inicio de la grabación del vídeo de identificación, o marcas de tiempo absolutas. En algunas de estas realizaciones, el dispositivo de grabación está configurado para interpretar la especificación de marca de agua única o cuasi única y generar una señal de marca de agua única o cuasi única de acuerdo con la especificación de marca de agua única o cuasi única. En los casos en los que un dispositivo de vibración admite diferentes frecuencias de vibración, con frecuencias que cambian gradualmente y/o continuamente, la especificación de marca de agua puede incluir información sobre la frecuencia de vibración.
El archivo de sonido o el archivo de datos de marca de agua puede contener un conjunto de frecuencias aleatorias nfreq con nfreq > 1 y una marca de tiempo tplay, donde las frecuencias están dentro, por encima y/o por debajo del rango audible, cambian de forma aleatoria o determinista en el tiempo o son constantes, y/o tienen diferentes características de duración, incluyendo las características de duración una longitud pulsada, constante limitada o ilimitada. Los términos “longitud constante limitada” y “longitud ilimitada” deben interpretarse en el contexto de la presente invención en el sentido de que, en el caso de una longitud ilimitada, la frecuencia estará presente hasta el final de la grabación de vídeo, mientras que una señal de longitud limitada terminará antes de que la grabación de vídeo concluya.
En los casos en los que las especificaciones de marca de agua o sus parámetros se eligen de forma determinista, la elección determinista puede sincronizarse con el tiempo o el recuento de solicitudes.
La señal de marca de agua puede ser una señal de vibración generada por un dispositivo de vibración del dispositivo de grabación. La vibración puede cambiar de forma aleatoria o determinista en el tiempo o ser constante y/o tener diferentes características de duración, por ejemplo, ser pulsada, constante o estar presente durante todo el tiempo de la grabación. Se ha hallado que las vibraciones del dispositivo de vibración son detectables en la grabación de vídeo en la pista de sonido o como una distorsión visual en la pista de vídeo. Además o alternativamente, un acelerómetro puede detectar dichas vibraciones. Por lo tanto, en una realización, las fluctuaciones detectadas por un acelerómetro del dispositivo de grabación se transmiten al dispositivo servidor en relación con los dos o más vídeos de identificación y son analizadas por el dispositivo servidor con respecto a su conformidad con la especificación de marca de agua única o cuasi única.
Los dispositivos de grabación con dispositivos de vibración incorporados pueden ser, por ejemplo, teléfonos inteligentes, tabletas u ordenadores portátiles con motores de vibración incorporados y/o accionamientos lineales, como los motores tápticos®. La finalidad de los motores tápticos es proporcionar una respuesta táctil y/o háptica y provocar la vibración del dispositivo o de partes del mismo. Normalmente, los dispositivos de vibración se apagan durante las grabaciones para no interrumpir y degradar la grabación, ya sea de audio o de vídeo. Sin embargo, se ha comprobado que los impulsos de vibración son claramente detectables en las grabaciones de audio, así como en las de vídeo, como ruido de fondo reconocible o como distorsiones o desenfoques reconocibles en la pista de vídeo. Las vibraciones, que normalmente son una molestia en el contexto de las grabaciones, pueden servir para proporcionar marcas de agua claramente reconocibles en la grabación. Otra ventaja es que el usuario será consciente de que se ha aplicado una marca de agua adecuada a la grabación mientras se realiza.
Es casi imposible para un atacante potencial manipular una grabación en su pista de audio o en su pista de vídeo o los datos de acelerómetro asociados con respecto a las señales o secuencias de marca de agua específicas causadas por la activación del dispositivo de vibración del dispositivo de grabación, así como predecir la secuencia exacta de marca de agua única o casi única, que puede tener un gran número de parámetros que pueden ser alterados para hacer que la secuencia de marca de agua sea única. Por lo tanto, se consigue una prueba en tiempo real muy robusta.
Esta marca de agua por vibración según la presente invención puede combinarse con una marca de agua más clásica mediante la inserción de sonidos audibles o no audibles (no ruido), que pueden llevar información adicional codificada en la estructura de frecuencias y pulsos de las marcas de agua sonoras.
La grabación de la secuencia o secuencias de marca de agua de vibración única o cuasi única puede ser sólo como marca de agua audible, visible o de aceleración, o como combinación de marca de agua audible y visible, como combinación de marca de agua audible y de aceleración o como combinación de marca de agua visible y de aceleración, o como combinación de marca de agua audible, visible y de aceleración, es decir, los efectos de la activación del dispositivo de vibración mensurables en uno, dos o los tres canales, a saber, la pista de audio, la pista de vídeo y los datos de acelerómetro.
Con ello, las marcas de agua pueden ser no sólo de naturaleza audible o visible, sino también de naturaleza vibratoria adecuada para su detección por un acelerómetro. Las marcas de agua audibles y visibles deben entenderse en este contexto como los efectos audibles y, respectivamente, visibles de la activación del dispositivo de vibración en la pista de audio y la pista de vídeo de la grabación, respectivamente. Una marca de agua de aceleración debe entenderse por tanto como una marca de agua vibratoria detectada por un acelerómetro o sensor de aceleración presente en muchos dispositivos de grabación modernos.
Dichos acelerómetros normalmente graban y registran la aceleración en 3-tuplas, es decir, con respecto a los ejes x, y y z en relación con un marco de referencia arbitrario del dispositivo de grabación, de valores de punto flotante que representan la aceleración a lo largo del eje respectivo, normalmente en la unidad de metros por segundo cuadrado o g (9,81 m/s2). Los datos de aceleración en bruto pueden extraerse del acelerómetro a una frecuencia de muestreo especificada, por ejemplo, 100 Hz, que es preferiblemente igual o superior a la frecuencia de cuadros de vídeo y/o a la frecuencia de vibración utilizada por el dispositivo de vibración. Los datos pueden proporcionarse como un vector [t, ax, ay, az] de marcas de tiempo t y aceleraciones ax, ay, az en las direcciones x, y y z en los tiempos respectivos. Los datos de aceleración registrados pueden ser transmitidos como un flujo de datos separado, por ejemplo, un archivo de texto o una cadena, que puede o no estar encriptada y/o firmada criptográficamente. Los datos pueden, alternativamente, ser incrustados como metadatos globales en la grabación. La mayoría de los formatos de contenedor de vídeo admiten la adición de metadatos arbitrarios. También se pueden incluir como metadatos en una base de cuadro a cuadro, ya que algunos formatos de contenedor de vídeo admiten dichos metadatos a nivel de cuadro. Los datos de aceleración pueden además ser incrustados como datos visibles o audibles en el propio flujo de audio o vídeo, si están presentes, o ser ocultados (por ejemplo, esteganográficamente) en el propio flujo de vídeo o audio, si están presentes, sin el conocimiento de un posible atacante que intercepte el mensaje.
Las realizaciones del método implican que el análisis de las señales de marca de agua en el paso c) de los vídeos de identificación realizado por el dispositivo servidor incluye uno o más de los siguientes elementos:
- supresión del ruido de fondo en la pista de audio de los vídeos de identificación con marca de agua,
- detección de ruido acústico y/o nivel de sonido en la pista de audio de los vídeos de identificación con marca de agua con respecto a las señales de vibración debidas a la activación de un dispositivo de vibración del dispositivo de grabación,
- detección de distorsión óptica en la pista de vídeo de los vídeos de identificación con marca de agua debido a la activación de un dispositivo de vibración del dispositivo de grabación,
- un análisis de Fourier que incluye la detección de picos en el espectro de Fourier de la pista de audio de los vídeos de identificación con marca de agua, o análisis similares de componentes principales u onditas,
- la comparación de un conjunto de frecuencias detectadas con un conjunto de frecuencias generadas según la especificación de marca de agua única o cuasi única,
- una verificación de la marca de tiempo de las señales detectadas, y
- una verificación de patrones con respecto a los cambios en las frecuencias detectadas y generadas.
Los conceptos matemáticos tales como los análisis de Fourier y las medidas técnicas de análisis de señales requeridas para llevar a cabo dichos análisis se enumeran anteriormente a modo de ejemplo y son bien conocidos por los expertos.
Los métodos de procesamiento de los datos de acelerómetro son similares al procesamiento de los datos de audio, ya que son similares por naturaleza, y pueden incluir todas las herramientas analíticas enumeradas anteriormente con respecto al análisis de la pista de audio en el paso c) del método de la invención, aunque adaptadas a la estructura y el contenido de los datos de acelerómetro. Estos métodos incluyen, por ejemplo, aunque sin limitación, extracción o recorte de secciones relevantes de los datos regrabados; supresión del ruido en los datos de acelerómetro, por ejemplo de las vibraciones constantes presentes en un vehículo o de los movimientos involuntarios del usuario final, en uno o múltiples ejes; normalización de los datos de acelerómetro en uno o múltiples ejes; comparación de plantillas y/o patrones de la(s) secuencia(s) de vibración con una referencia; análisis de Fourier, análisis de componentes principales o análisis de onditas y métodos similares para extraer o validar las frecuencias de vibración. Las señales pueden aislarse de otros componentes del flujo de datos, por ejemplo, mediante filtrado, como filtrado del ruido de baja frecuencia de hasta 50 Hz o 100 Hz representativo de las señales de vibración, que también puede tenerse en cuenta mediante la elección de una frecuencia de muestreo adecuada. El análisis de las mediciones de acelerómetro puede incluir, entre otras cosas, la evaluación de la coherencia de los datos de vídeo y/o audio y de los datos de sensor de acelerómetro mediante, por ejemplo, el análisis de plantillas; el análisis de correlación (cruzada) de las magnitudes y patrones “de fondo”, por ejemplo, entre los movimientos visibles en el vídeo causados por el usuario final y las aceleraciones medidas; la asociación temporal de la magnitud o los patrones de vibración observados en los datos de vídeo, audio y/o acelerómetro durante la marca de agua; la evaluación del entorno y la comprobación cruzada con casos anteriores y/o datos almacenados.
El análisis de los datos de vídeo para efectos de la vibración puede incluir un análisis de la nitidez de la imagen, ya que la vibración producirá una cierta cantidad de desenfoque. El análisis de la nitidez puede realizarse mediante el promedio de la inclinación del contraste (variación de brillo de píxel a píxel) con respecto a los valores de brillo (escala de grises) y/o de color, y/o la detección de la nitidez de los bordes.
El análisis de los datos de audio para efectos vibratorios puede incluir muchos de los métodos de análisis mencionados anteriormente en relación con el análisis de los datos de acelerómetro, y puede incluir uno o más de, entre otros, la normalización de la amplitud de la pista de audio o de la grabación de audio, el recorte de las partes de la grabación que contienen las señales de marca de agua y el filtrado mediante filtros de paso alto, paso bajo o paso banda.
En la solicitud de patente europea paralela del solicitante de la presente, titulada “Método y sistema para la prueba en tiempo real de una grabación”, presentada en la misma fecha que la presente solicitud, se ofrecen más detalles sobre la marca de agua vibratoria.
Otros usos de los datos de acelerómetro pueden incluir la comprobación de los movimientos del usuario durante la grabación, como la detección de acciones de entrada manual, como pulsar un botón físico o un botón virtual mostrado en la pantalla del dispositivo de grabación. Los datos de movimiento del acelerómetro también pueden analizarse para comprobar la coherencia con los movimientos visuales de la pista de vídeo de la grabación. Este análisis, o el análisis de los datos de acelerómetro en general, también puede extenderse a una secuencia de indicaciones al usuario y/o grabaciones, incluyendo la secuencia la identificación del usuario y/o la identificación basada en documento, incluyendo una o más secuencias de vídeo y/o grabaciones, demostrando así su unidad como una única instancia de identificación por vídeo.
En otra realización, los datos de acelerómetro pueden ir acompañados de datos de localización, como los procedentes de los sensores GPS y los sensores WiFi con respecto al SSID y la locación de la dirección IP del nodo WiFi.
La llamada comprobación de la capacidad de reacción puede realizarse pidiendo a la persona que realice una acción predeterminada antes de iniciar la grabación o durante la misma, que puede comprobarse durante la evaluación, como, por ejemplo, pronunciar palabras o frases, mover los ojos, mover la cabeza, responder a preguntas, etc. La unidad de evaluación puede comprobar, por ejemplo, si los movimientos de los labios coinciden con las palabras que se van a pronunciar, y si las palabras son audibles en la pista de audio de la grabación. Esto puede usarse como prueba evaluada por la máquina de la vida del usuario frente a la cámara, ya que los rasgos faciales en una foto no se moverían. En EP 1 147 494 B1 se describe, por ejemplo, un método que especifica diferentes formas de realizar dicha comprobación de vida.
En una realización, se lleva a cabo una comprobación de vida relacionada con el usuario en la que éste demuestra su presencia en el momento de la ejecución del proceso de identificación. Esto puede lograrse requiriendo al cliente que proporcione un vídeo de sí mismo, por ejemplo, por medio de un vídeo selfie, durante el cual se le pide que demuestre su presencia por algún medio de mecanismo de desafío-respuesta, por ejemplo, teniendo que leer de nuevo algunas palabras generadas aleatoriamente o pseudo-aleatoriamente o realizando una determinada acción inducida aleatoriamente. Si la acción de comprobación de la capacidad de respuesta es diferente en cada caso, la comprobación de la capacidad de respuesta puede utilizarse como una prueba más en tiempo real. De este modo, se podría identificar la reproducción repetida de una grabación que incluya una comprobación de vida real.
Al igual que muchas características de seguridad, los controles de vida pueden ser atacados, en parte de forma trivial, incluso si el control de vida sirve como prueba adicional en tiempo real. Esto puede mejorarse haciendo que las indicaciones al usuario sean aleatorias y, al mismo tiempo, difíciles de entender para las máquinas. Estas indicaciones pueden consistir en la resolución de una pregunta o un acertijo, que es fácil para los humanos, pero difícil para las máquinas, como proporcionar secuencias de letras y números en tipos de letra alternativos en la pantalla u otras tareas denominadas “captcha”. De este modo, la comprobación de la capacidad de respuesta no sólo se puede utilizar con respecto a la capacidad de respuesta, sino también para asegurar el tiempo específico de la grabación. Como todos los sistemas de seguridad, el presente sistema de seguridad puede mejorarse haciendo que incorpore múltiples factores de seguridad.
Con el fin de implementar una comprobación de vida relacionada con el usuario, en una realización, se lleva a cabo un mecanismo de desafío-respuesta cuando se capturan características biométricas del usuario, en el que, en particular, el dispositivo de grabación solicita una frase de paso de autenticación única al dispositivo servidor, el dispositivo servidor selecciona o genera una frase de paso de autenticación única con npalabras ^ 1 palabras seleccionadas de forma aleatoria, y proporciona la frase de paso de autenticación única al dispositivo de grabación, donde el dispositivo de grabación muestra la frase de paso de autenticación única para el usuario y le pide que diga la autenticación única durante la grabación de los vídeos de identificación con marca de agua, donde el dispositivo servidor analiza además los vídeos de identificación con marca de agua con respecto a la presencia de datos de audio y/o datos de vídeo identificables como el usuario que dice la frase de paso de autenticación única. Otros medios alternativos de un mecanismo de desafío-respuesta son, por ejemplo, plantear una pregunta seleccionada al azar y hacer que el usuario responda a esa pregunta verbalmente. La pregunta puede incluir, entre otros, cálculos matemáticos sencillos. Tales desafíos pueden ser presentados como imágenes, haciendo más difícil en el proceso que las máquinas los interpreten.
En otra realización, se lleva a cabo una comprobación de vida relacionada con el usuario cuando se captura un documento de identificación personal del usuario, en particular el dispositivo de grabación que muestra al usuario información que le pide que mueva, incline y/o gire el documento de identificación personal, en particular de manera que se capturen las características de seguridad de la identificación personal, en particular hologramas o tinta variable óptica (TVO), que cambian de visibilidad dependiendo de los ángulos específicos de iluminación y visualización. Estos cambios visibles de las características del documento de identificación personal se observan en el análisis posterior del vídeo de identificación con marca de agua y se toman como prueba de la validez de la grabación de vídeo del documento y de la validez del propio documento.
El vídeo de identificación biométrica y el vídeo de identificación del documento pueden compararse entre sí con respecto a la similitud de los parámetros de grabación y/o los entornos, en particular comparando los rangos dinámicos, los niveles de ruido de fondo y/o las intensidades de señal relativas de las frecuencias extraídas. Una similitud en los parámetros de grabación y/o en el entorno es indicativa de que los vídeos han sido tomados en el mismo lugar y en sucesión temporal, aumentando así la probabilidad de que pertenezcan al mismo acto de identificación del usuario. El rango dinámico de la pista de audio puede determinarse mediante las amplitudes y/o frecuencias mínimas y máximas observadas en el espectro sonoro a lo largo de todo el vídeo grabado, con lo que se obtiene una huella del dispositivo de grabación.
En una realización, en caso de que al menos una grabación de vídeo de identificación con marca de agua anterior y/o características biométricas extraídas de vídeos de identificación con marca de agua anteriores esté o estén almacenadas en el dispositivo servidor o sean accesibles a él, el vídeo de identificación con marca de agua grabado se compara con al menos uno o múltiples vídeos con marca de agua anteriores con respecto a las características biométricas visibles y/o relacionadas con la voz del usuario, en particular la coincidencia de patrones de voz, y/o con respecto a la similitud de los parámetros de grabación y/o los entornos, en particular comparando el rango dinámico, los niveles de ruido de fondo y/o las intensidades de señal relativas de las frecuencias extraídas. Según una realización, la comparación de los vídeos de identificación con marca de agua se analiza con respecto a la probabilidad de que los distintos vídeos de identificación con marca de agua se hayan grabado en el mismo lugar y/o posteriormente en el mismo momento. Si algunos de estos factores coinciden con grabaciones anteriores, es indicativo de una baja probabilidad de que se haya producido una manipulación. Por ejemplo, un rango dinámico coincidente puede indicar una fuerte probabilidad de que se haya utilizado el mismo dispositivo de grabación en múltiples casos.
Hay que tener en cuenta que el proceso mencionado puede aplicarse a cualquier vídeo para validar su autenticidad y viveza, no sólo al ejemplo o ejemplos descritos. Otros casos de uso se discuten a continuación. Sin limitar el alcance de la usabilidad, los métodos descritos pueden aplicarse en su totalidad o en partes a una multitud de escenarios y casos de uso, por ejemplo, pero sin limitación, a
- la validación de dos o más vídeos grabados por una aplicación en cualquier dispositivo de grabación capaz, como un teléfono inteligente, un ordenador portátil o similar, que se cargan y procesan en un servidor como medio de validación en tiempo real y de protección contra manipulaciones, como
° reproducción de un vídeo pregrabado potencialmente manipulado en una pantalla que se graba y se presenta (“intento de fraude analógico/físico”)
° inserción de un vídeo pregrabado potencialmente manipulado en el dispositivo en cuestión mediante ingeniería inversa de la aplicación (“intento de fraude digital”)
° la manipulación en tiempo real del componente de audio y/o vídeo de la grabación de vídeo para alterar el contenido de los datos de voz o de audio o de las imágenes faciales enviadas al servidor (por ejemplo, cambiando la información transmitida por el cliente),
- la validación en tiempo real (o la comprobación de vida) y/o el desafío de autenticación de las videollamadas, como las videollamadas de apoyo, las videollamadas bancarias o las videollamadas médicas,
- la validación en tiempo real (o la comprobación de vida) y/o la impugnación de la autenticación de las llamadas de voz, como las situaciones de teleasistencia, telebanca o telemedicina, la identificación y/o el desafío de autenticación de una persona en el contexto de un encuentro personal, por ejemplo
° un proceso de pago mediante un vídeo selfie de una persona, o
° un registro en el mostrador de un consultorio médico o de un mostrador de autos compartidos.
El objeto de la presente invención se consigue también con un sistema para validar la identificación remota de grabación de vídeo en vivo de un usuario, comprendiendo el sistema al menos un dispositivo servidor y al menos un dispositivo de grabación conectado o conectable remotamente al al menos un dispositivo servidor, donde el dispositivo cliente comprende una cámara y un micrófono y está equipado para grabar vídeos con la cámara y el micrófono, donde el dispositivo de grabación comprende además al menos uno de un dispositivo de altavoz y un dispositivo de vibración y está equipado para grabar vídeos con la cámara y el micrófono, donde el dispositivo servidor comprende una primera unidad configurada para seleccionar o generar especificaciones de marca de agua únicas a petición del dispositivo cliente y una segunda unidad configurada para analizar los vídeos de identificación con marca de agua transmitidos por el dispositivo cliente de acuerdo con un método previamente presentado según la invención. El sistema tiene así las mismas características, ventajas y propiedades que el método según la invención.
En realizaciones, el dispositivo de grabación comprende además una pantalla configurada para mostrar los comandos a seguir por un usuario y/o un acelerómetro.
Otras características de la invención serán evidentes a partir de la descripción de las realizaciones según la invención junto con las reivindicaciones y los dibujos incluidos. Las realizaciones según la invención pueden cumplir con características individuales o una combinación de varias características.
La invención se describe a continuación, sin restringir la intención general de la invención, basándose en realizaciones ejemplares, en las que se hace referencia expresamente a los dibujos con respecto a la descripción de todos los detalles según la invención que no se explican con mayor detalle en el texto. Los dibujos muestran en: La figura 1 una representación esquemática de un sistema que realiza un método según una realización de la invención y
La figura 2 una representación esquemática de un sistema que realiza un método según una segunda realización de la invención.
En los dibujos, los mismos o similares tipos de elementos o respectivamente partes correspondientes llevan los mismos números de referencia para evitar que el artículo tenga que ser presentado de nuevo.
En las figuras 1 y 2, se muestra un sistema 10 que comprende un dispositivo servidor 20 y un dispositivo de grabación 30, en el que el dispositivo de grabación 30 está conectado remotamente al dispositivo servidor 20. El dispositivo servidor 20 se representa como un servidor estándar que comprende un dispositivo informático 22, como, por ejemplo, un ordenador, y un dispositivo de almacenamiento 24. El dispositivo informático 22 puede tener implementada una primera unidad 26 para generar o seleccionar firmas de marca de agua únicas o casi únicas y una segunda unidad 28 para analizar los vídeos de identificación. El dispositivo de grabación 30 se representa como un teléfono inteligente, en el que se han representado además varias características, encima de la pantalla 32, a saber, una cámara 34, un dispositivo de vibración 40 y un acelerómetro 42. Además, se muestran el dispositivo de altavoz 36 y el micrófono 38.
El dispositivo servidor 20 puede estar situado en cualquier lugar, como por ejemplo una ubicación central para una multitud de aplicaciones o usos. En este caso, un proveedor de identificación y autenticación puede ser contratado por proveedores de servicios específicos para proporcionar la identificación y autenticación de los usuarios para sus servicios. Alternativamente, el dispositivo servidor 20 puede estar ubicado localmente con un proveedor de servicios y dedicado a un servicio solamente.
El sistema no se limita al dispositivo servidor 20 representado en la figura 1 y la figura 2 o al teléfono inteligente como dispositivo de grabación 30 representado en la figura 1 o la figura 2. El dispositivo de grabación 30 también puede ser un ordenador portátil, una tableta o algún otro dispositivo dedicado capaz y configurado para llevar a cabo las partes del proceso asignadas al dispositivo de grabación 30.
A continuación, se describirán varios procesos con respecto al sistema mostrado en la figura 1 y la figura 2.
En una primera realización, el dispositivo de grabación 30 inicializa un caso de proceso con el dispositivo servidor 20. Como parte de la inicialización, el dispositivo de grabación 30 solicita en el paso 51 una especificación de marca de agua única o cuasi única, por ejemplo, un archivo de sonido de marca de agua único o cuasi único, desde el dispositivo servidor 20. Alternativamente, la especificación de marca de agua única o cuasi-única puede contener instrucciones específicas para generar una señal de marca de agua única o cuasi-única.
En el caso de un archivo de sonido, el dispositivo servidor 20 genera entonces en el paso 52 un archivo de sonido que contiene un conjunto de frecuencias aleatorias nfreq (nfreq > 1) Fgen y una marca de tiempo tplay. Las frecuencias pueden estar de forma aleatoria o determinista dentro del rango audible, por debajo y/o por encima de dicho rango, cambiar en el tiempo o ser constantes, y tener diferentes características de duración, por ejemplo, pulsada, constante, y también pueden estar presentes durante todo el tiempo de la grabación. Esta información también puede estar presente incrustada en una especificación de marca de agua única o casi única proporcionada por el dispositivo servidor 20 al dispositivo de grabación 30. En lugar de generar la especificación de marca de agua única o cuasi única, la especificación de marca de agua única o cuasi única también puede ser elegida al azar de entre una multitud de especificaciones de marca de agua únicas o cuasi únicas pregeneradas y almacenadas.
La especificación de marca de agua única o casi única se proporciona entonces al dispositivo de grabación 30 en el paso 53. En el paso 54, el dispositivo de grabación 30 graba un vídeo y reproduce el archivo de sonido o genera una señal de marca de agua única o casi única de acuerdo con la especificación de marca de agua única o casi única mientras se graba el vídeo en el índice de tiempo tplay proporcionado en relación con el inicio de la grabación en el dispositivo de grabación 30, marcando con agua la grabación en el proceso. Ejemplos de grabaciones de vídeo son un simple vídeo selfie de un usuario, un vídeo selfie de un usuario, durante el cual se presentan al usuario npalabras aleatorias generadas o seleccionadas por el dispositivo servidor 20 que se le pide que pronuncie verbalmente en el momento de la grabación, proporcionando así una comprobación y verificación de vida, un vídeo de un documento de identificación personal, por ejemplo, una tarjeta de identidad, un pasaporte, un permiso de conducir o una tarjeta de identificación de seguro médico, durante el cual se pide al usuario que mueva el documento en cuestión de manera que ciertas características de seguridad, por ejemplo, hologramas, sean visibles y/o cambien con el tiempo, o en general cualquier tipo de grabación de vídeo, sin limitarse a los ejemplos anteriores.
En el paso 55, el dispositivo de grabación 30 envía el vídeo de identificación con marca de agua al dispositivo servidor 20 para su análisis. En el paso 56, el dispositivo servidor 20 realiza un análisis de la grabación de vídeo de identificación con marca de agua con respecto a la identificación del usuario y la validación de la grabación de vídeo por medio de la firma de marca de agua única o casi única y cualquier otra información de validación y comprobación de vida incrustada en la misma. En particular, el dispositivo servidor 20 puede realizar uno, varios o todos los pasos siguientes:
- supresión de ruido para reducir el ruido de fondo constante,
- análisis de Fourier, ondita o componentes principales para extraer las principales frecuencias contenidas en la capa de sonido del archivo de vídeo,
- detección de picos en el espectro de Fourier para extraer las frecuencias grabadas Frec, o extracción equivalente de las frecuencias grabadas a partir del análisis de onditas o de componentes principales
- comparación del conjunto de frecuencias generadas Fgen y del conjunto de frecuencias extraídas Frec, en la que la marca de agua y, por tanto, el vídeo se consideran válidos si se cumplen determinadas condiciones, idealmente, si Fgen _ Frec,
- verificación de la marca de tiempo para validar que las frecuencias han sido reproducidas o generadas a partir del momento solicitado tplay,
- verificación de patrones para validar que los cambios en las frecuencias generadas Fgen, por ejemplo, la pulsación, están presentes también en las frecuencias grabadas Frec,
- comparación de voz de las palabras habladas en el video selfie con los datos de voz archivados, si están presentes.
El análisis también puede incluir la identificación de los movimientos de los labios y la correlación de los movimientos de los labios del usuario con una frase de paso única presentada al usuario, o un reconocimiento de voz completo para la identificación de la pronunciación de la frase de paso única por el usuario.
El vídeo de identificación puede comprender tanto imágenes de vídeo de la cara y el sonido de la voz del usuario como del documento de identificación personal que se presentará cuando el dispositivo de grabación 30 lo solicite. Cualquier orden al usuario, por ejemplo, para mostrar el documento de identificación personal, para realizar movimientos específicos del documento de identificación personal, para pronunciar una frase de paso única, puede ir acompañada de marcas de agua acústicas inaudibles específicas para la orden respectiva, de modo que el análisis del archivo de vídeo con respecto al documento de identificación personal y la pronunciación de la frase de paso única puede ser ayudado restringiendo el análisis respectivo a las partes del vídeo que están marcadas con respecto a las órdenes dadas al usuario. Estas marcas de agua relacionadas con los comandos no deben confundirse con las marcas de agua únicas o casi únicas.
La identificación de la firma de marca de agua única o cuasi única dentro del vídeo de identificación también puede lograrse analizando la pista de audio y/o la pista de vídeo en busca de señales indicativas de la activación del dispositivo de vibración 40 del dispositivo de grabación 30. Dicha señal se presentará en la señal de vídeo como el desenfoque o la distorsión presente durante el tiempo de activación del dispositivo de vibración 40. Dependiendo de la interferencia entre la frecuencia del dispositivo de vibración y la frecuencia de captura de imagen en la secuencia de vídeo, la vibración puede dar lugar a un bamboleo periódico de la imagen capturada. La vibración también puede ser recogida por un acelerómetro 42, cuya información también puede ser indexada en el tiempo y transmitida al dispositivo servidor 20 para su análisis.
El método representado en la figura 2 es en muchos aspectos similar al representado en la figura 1. De nuevo, cuando el usuario inicializa el caso de proceso con el servidor, como parte de esta inicialización, el dispositivo de grabación 30 solicita en el paso 61 una especificación de marca de agua única o cuasi única, tal como un archivo de sonido de marca de agua único o cuasi único, del dispositivo servidor 20. En el paso 62, el dispositivo servidor 20 genera en una primera unidad 26 del mismo una especificación de marca de agua única o cuasi única que contiene en una alternativa un conjunto de frecuencias aleatorias o instrucciones de vibración y marcas de tiempo, por lo tanto, en una alternativa integrada en un archivo de sonido de marca de agua única o cuasi única, y devuelve la especificación de marca de agua única o cuasi única solicitada en el paso 63 al dispositivo de grabación 30.
Además de la especificación de marca de agua única o casi única, el paquete de datos devuelto al dispositivo de grabación 30 puede contener también una frase de paso de una o más palabras seleccionadas aleatoriamente por el dispositivo servidor 20. En el paso 64, el dispositivo de grabación 30 graba un vídeo selfie como vídeo de identificación biométrica del usuario, durante el cual se le presentan al usuario las palabras de la frase de paso que debe pronunciar verbalmente en el momento de la grabación. De este modo, se consigue una comprobación y verificación de vida. Durante la grabación, se reproduce o se genera una señal de marca de agua única o casi única de acuerdo con la firma de marca de agua única o casi única en los índices de tiempo proporcionados, con lo que se crea una marca de agua en la grabación en el proceso. El dispositivo de grabación 30 en el paso 65 envía entonces el vídeo selfie con marca de agua al dispositivo servidor 20 para su análisis.
En el paso 66, el dispositivo de grabación 30 graba un vídeo de identificación de documentos, grabando un vídeo de un documento de identificación personal, durante el cual se pide al usuario que mueva el documento en cuestión de manera que ciertas características de seguridad, por ejemplo, hologramas, sean visibles y/o cambien con el tiempo. Durante la grabación, se genera o se reproduce la misma señal de marca de agua, única o casi única, en un índice de tiempo proporcionado en relación con el inicio de la grabación en el dispositivo de grabación 30, marcando la grabación con una marca de agua en el proceso. El uso de la misma señal de marca de agua única o casi única y de la misma firma de marca de agua única o casi única que en el vídeo de identificación biométrica vinculará los dos vídeos de identificación entre sí. Sin embargo, el uso de firmas de marca de agua únicas o casi únicas para cada uno de los dos vídeos de identificación disminuirá aún más el peligro de manipulación y robo de identidad, ya que sería imposible extraer la firma de marca de agua única o casi única de la primera grabación e insertarla en la segunda grabación.
El orden de grabación del vídeo de identificación biométrica y del vídeo de identificación de documentos puede invertirse con respecto al orden mostrado en la figura 2.
El dispositivo de grabación 30 enviará entonces el vídeo de identificación de documento con marca de agua al dispositivo servidor 20 para su análisis en el paso 67, que entonces se realiza en el paso 68 en una segunda unidad 28 del dispositivo servidor 20 de acuerdo con la descripción dada con respecto al método representado en la figura 1. Si el usuario debe pronunciar una frase de paso, el dispositivo servidor 20 puede realizar además un reconocimiento de voz para extraer la frase de paso única de la pista de audio del vídeo de identificación. Esto puede realizarse independientemente de si se graba un solo vídeo de identificación o dos vídeos de identificación separados.
En caso de que se capturen dos vídeos de identificación separados, el dispositivo servidor 20 puede realizar uno, varios o todos los pasos adicionales siguientes:
- comparación del ruido de fondo en ambos vídeos para validar que ambos vídeos fueron capturados en el mismo entorno,
- comparación de la intensidad de señal relativa de las frecuencias extraídas para validar que ambos vídeos fueron capturados en el mismo entorno,
- comparación del ruido de fondo con datos archivados, por ejemplo, de casos de procesos anteriores, para validar que los vídeos fueron capturados en el mismo entorno,
- comparación de la intensidad de señal relativa de las frecuencias extraídas con los datos archivados, por ejemplo, de casos de procesos anteriores, para validar que ambos vídeos fueron capturados en el mismo entorno.
Cabe señalar que el proceso mencionado anteriormente puede generalizarse a N (N > 2) vídeos que deben validarse y/o combinarse. Varios de los métodos y/o procesos de validación mencionados anteriormente no son necesariamente criterios “duros” para rechazar y/o aceptar un vídeo, sino que pueden combinarse en una puntuación de validez o probabilidad que finalmente se utiliza para caracterizar el vídeo. Por ejemplo, una falta de coincidencia en la comparación de los niveles de ruido de fondo entre dos o más vídeos no significa necesariamente un fallo de validación, ya que ambos vídeos podrían haber sido tomados simplemente en habitaciones diferentes, pero una coincidencia aumenta la probabilidad de que ambos vídeos hayan sido grabados en el mismo momento y/o lugar; una falta de coincidencia de los datos actuales con los datos archivados, independientemente de la métrica en cuestión, no significa necesariamente un fallo de validación, ya que las condiciones podrían ser diferentes en un momento distinto, pero una coincidencia aumenta la probabilidad de que ambos vídeos hayan sido grabados en el mismo momento y/o lugar.
Todas las características indicadas, incluyendo las tomadas de los dibujos solamente, y las características individuales, que se exponen en combinación con otras características, se consideran importantes para la invención solas y en combinación. Las realizaciones según la invención pueden cumplirse mediante características individuales o una combinación de varias características. Las características que se combinan con la expresión “en particular” o “especialmente” deben tratarse como realizaciones preferidas.
Lista de referencias
10: sistema
20: dispositivo servidor
22: dispositivo informático
24: dispositivo de almacenamiento
26: primera unidad
28: segunda unidad
30: dispositivo de grabación
32: pantalla
34: cámara
36: dispositivo de altavoz
38: micrófono
: dispositivo de vibración
: acelerómetro
: solicitar especificación de marca de agua única o casi única, frase de paso
: generar/seleccionar una especificación de marca de agua única o casi única, frase de paso : proporcionar una especificación de marca de agua única o casi única, frase de paso : grabar vídeo, generar señal de marca de agua única o casi única, solicitar frase de paso : enviar el archivo de vídeo con marca de agua al dispositivo servidor
: analizar el archivo de vídeo con marca de agua
: solicitar especificación de marca de agua única o casi única, frase de paso
: generar/seleccionar una especificación de marca de agua única o casi única, frase de paso : proporcionar una especificación de marca de agua única o casi única, frase de paso : grabar vídeo, generar señal de marca de agua única o casi única, solicitar frase de paso : enviar el archivo de vídeo con marca de agua al dispositivo servidor
: grabar un segundo vídeo y generar una señal de marca de agua única o casi única : enviar el segundo archivo de vídeo con marca de agua al dispositivo servidor
: analizar los archivos de vídeo con marca de agua

Claims (14)

REIVINDICACIONES
1. Método para validar la identificación de un usuario por grabación de vídeo en vivo a distancia, en el que en un sistema (10) que comprende al menos un dispositivo de grabación (30) equipado para grabar un vídeo, se llevan a cabo sucesivamente los siguientes pasos:
a) el dispositivo de grabación (30) graba (54, 64, 66) dos o más vídeos de identificación con marca de agua que capturan rasgos biométricos del usuario y un documento de identificación personal del usuario en el que se incluye al menos una comprobación de vida relacionada con el usuario, en el que los dos o más vídeos de identificación tienen marca de agua, en el que durante la grabación de los vídeos de identificación el dispositivo de grabación (30) genera señales físicas de marca de agua de acuerdo con una especificación de marca de agua única o casi única, donde las señales físicas de marca de agua entran en la pista de audio y/o en la pista de vídeo mediante oscilaciones físicas generadas por un dispositivo de altavoz (36) del dispositivo de grabación (30) y/o un dispositivo de vibración (40) del dispositivo de grabación (30) y grabadas por un micrófono (38), una cámara (34) y/o un acelerómetro (42) del dispositivo de grabación (30), en el que se graban al menos dos vídeos de identificación separados (64, 66) con al menos un vídeo de identificación biométrica que captura las características biométricas del usuario y al menos un vídeo de identificación de documentos separado que captura el documento de identificación personal del usuario, en el que los al menos dos vídeos de identificación separados llevan una marca de agua utilizando diferentes especificaciones de marca de agua únicas o casi únicas,
b) los vídeos de identificación con marca de agua grabados son analizados por una unidad de análisis del dispositivo de grabación (30) o de un dispositivo servidor (20) durante la grabación de los vídeos de identificación con marca de agua o tras finalizar la grabación de los vídeos de identificación con marca de agua, y
c) la unidad de análisis analiza (56, 68) los vídeos de identificación con marca de agua en busca de información de identificación del usuario y en busca de la presencia de señales de marca de agua de acuerdo con las especificaciones de marca de agua únicas o casi únicas,
donde el vídeo de identificación biométrica y el vídeo de identificación de documentos se comparan entre sí con respecto a una similitud de parámetros de grabación y/o entornos.
2. Método según la reivindicación 1, en el que el sistema comprende además un dispositivo servidor (20), al que el dispositivo de grabación (30) está conectado o es conectable, en el que, antes de la grabación, el usuario inicializa una solicitud de identificación en el dispositivo de grabación (30), el dispositivo de grabación (30) solicita (51, 61) una especificación de marca de agua única a un dispositivo servidor (20), y el dispositivo servidor (20) selecciona o genera (52, 62) una especificación de marca de agua única o casi única y proporciona (53, 63) la especificación de marca de agua única o casi única al dispositivo de grabación (30).
3. Método según la reivindicación 1 o 2, caracterizado porque la especificación de marca de agua única o cuasi única es un archivo de sonido de marca de agua que será reproducido al menos una vez por el dispositivo de grabación (30) al comienzo de la grabación y/o una o más veces especificadas después del comienzo de la grabación, o la especificación de marca de agua única o cuasi única es un archivo de datos de marca de agua que contiene la especificación de una serie no aleatoria o aleatoria de una o más frecuencias de sonido y/o señales de vibración, incluyendo en particular información de temporización, contando la información de temporización en particular desde el momento del inicio de la grabación del vídeo de identificación, o marcas de tiempo absolutas.
4. Método según la reivindicación 3, caracterizado porque el archivo de sonido o el archivo de datos de marca de agua contiene un conjunto de nfreq frecuencias aleatorias con nfreq > 1 y una marca de tiempo tplay, en el que las frecuencias están dentro, por encima y/o por debajo del rango audible, cambian aleatoriamente o de forma determinista en el tiempo o son constantes, y/o tienen diferentes características de duración, incluyendo las características de duración una longitud pulsada, constante limitada o ilimitada.
5. Método según una de las reivindicaciones 1 a 4, caracterizado porque las fluctuaciones detectadas por un acelerómetro (42) del dispositivo de grabación (30) se transmiten al dispositivo servidor (20) en conexión con los dos o más vídeos de identificación y son analizadas por el dispositivo servidor (20) con respecto a su conformidad con la especificación de marca de agua única o casi única.
6. Método según una de las reivindicaciones 1 a 5, caracterizado porque el análisis de los signos de marca de agua en el paso c) de los vídeos de identificación realizado por el dispositivo servidor (20) incluye uno o más de: - supresión del ruido de fondo en la pista de audio de los vídeos de identificación con marca de agua,
- detección del nivel de ruido acústico en la pista de audio de los vídeos de identificación con marca de agua con respecto a las señales de vibración debido a la activación de un dispositivo de vibración del dispositivo de grabación, - detección de la distorsión óptica en las pistas de vídeo de los vídeos de identificación con marca de agua debido a la activación de un dispositivo de vibración del dispositivo de grabación,
- un análisis de Fourier que incluye la detección de picos en el espectro de Fourier de las pistas de audio de los vídeos de identificación con marca de agua, o análisis de componentes principales o de onditas,
- la comparación de un conjunto de frecuencias detectadas con un conjunto de frecuencias generadas según la especificación de marca de agua única o cuasi única
- una verificación de la marca de tiempo de las señales detectadas, y
- una verificación de patrones con respecto a los cambios en las frecuencias detectadas y generadas.
7. Método según una de las reivindicaciones 1 a 6, caracterizado porque los datos de acelerómetro se analizan a lo largo de una secuencia de indicaciones al usuario y/o grabaciones, incluyendo la secuencia la identificación de usuario y/o la identificación basada en documento, que incluye una o más secuencias de vídeo/o y grabaciones.
8. Método según una de las reivindicaciones 1 a 7, caracterizado porque, al capturar características biométricas del usuario, se realiza una comprobación de vida del usuario mediante un mecanismo de desafío-respuesta, en el que, en particular, el dispositivo de grabación (30) solicita (51, 61) una frase de paso de autenticación única al dispositivo servidor (20), el dispositivo servidor (20) selecciona o genera (52, 62) una frase de paso de autenticación única con npalabras ^ 1 palabras seleccionadas al azar y proporciona (53, 63) la frase de paso de autenticación única al dispositivo de grabación (30), en el que el dispositivo de grabación (30) muestra la frase de paso de autenticación única al usuario y le pide que diga la autenticación única durante la grabación de los vídeos de identificación con marca de agua, en el que el dispositivo servidor (20) analiza además (56, 68) los vídeos de identificación con marca de agua con respecto a la presencia de datos de audio y/o datos de vídeo identificables como el usuario que dice la frase de paso de autenticación única.
9. Método según una de las reivindicaciones 1 a 8, caracterizado porque, al capturar un documento de identificación personal del usuario, se realiza una comprobación de la capacidad de reacción del usuario, en particular, el dispositivo de grabación (30) muestra al usuario información que le pide que mueva, incline y/o gire el documento de identificación personal, en particular, de manera que se capturen las características de seguridad de la identificación personal, en particular, los hologramas o la tinta óptica variable, que cambian de visibilidad en función de los ángulos específicos de iluminación y visión.
10. Método según una de las reivindicaciones 1 a 9, caracterizado porque el vídeo de identificación biométrica y el vídeo de identificación de documento se comparan entre sí con respecto a los rangos dinámicos, los niveles de ruido de fondo y/o las intensidades de señal relativas de las frecuencias extraídas.
11. Método según una de las reivindicaciones 1 a 10, caracterizado porque, en el caso de que al menos una grabación de vídeo de identificación con marca de agua anterior y/o las características biométricas extraídas de vídeos de identificación con marca de agua anteriores esté o estén almacenadas o sean accesibles al dispositivo servidor (30), el vídeo de identificación con marca de agua grabado se compara con al menos uno o varios vídeos de identificación con marca de agua anteriores con respecto a las características biométricas visibles y/o relacionadas con la voz del usuario, en particular la coincidencia de patrones de voz, y/o con respecto a una similitud de parámetros de grabación y/o entornos, en particular comparando el rango dinámico, los niveles de ruido de fondo y/o las intensidades de señal relativas de las frecuencias extraídas.
12. Método según la reivindicación 10 u 11, caracterizado porque la comparación de los vídeos de identificación con marca de agua se analiza con respecto a una probabilidad de que los distintos vídeos de identificación con marca de agua se graben en el mismo lugar y/o posteriormente en el mismo momento.
13. Sistema (10) para validar la identificación remota de grabación de vídeo en vivo de un usuario, comprendiendo el sistema (10) al menos un dispositivo servidor (20) y al menos un dispositivo de grabación (30) conectado o conectable al al menos un dispositivo servidor (20), donde el dispositivo cliente (30) comprende una cámara (34) y un micrófono (38) y está equipado para grabar vídeos con la cámara (34) y el micrófono (38), donde el dispositivo de grabación (30) comprende además al menos uno de un dispositivo de altavoz (36) y un dispositivo de vibración (40), donde el dispositivo servidor (20) comprende una primera unidad (26) configurada para seleccionar o generar especificaciones de marca de agua únicas o casi únicas a petición del dispositivo de grabación (30) y una segunda unidad (28) configurada para analizar los vídeos de identificación con marca de agua transmitidos por el dispositivo de grabación (30) de acuerdo con un método según una de las reivindicaciones 1 a 12.
14. Sistema (10) según la reivindicación 13, caracterizado porque el dispositivo de grabación (30) comprende además una pantalla (32) configurada para mostrar las órdenes a seguir por un usuario y/o un acelerómetro (42).
ES18175372T 2018-05-31 2018-05-31 Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo Active ES2908284T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP18175372.4A EP3575993B1 (en) 2018-05-31 2018-05-31 Method and system for validating remote live identification via video-recording

Publications (1)

Publication Number Publication Date
ES2908284T3 true ES2908284T3 (es) 2022-04-28

Family

ID=62495629

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18175372T Active ES2908284T3 (es) 2018-05-31 2018-05-31 Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo

Country Status (2)

Country Link
EP (1) EP3575993B1 (es)
ES (1) ES2908284T3 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11494517B2 (en) * 2020-02-12 2022-11-08 Uber Technologies, Inc. Computer system and device for controlling use of secure media recordings
US11582274B2 (en) 2020-11-10 2023-02-14 Trustybell GmbH Videoconferencing system
CN113194122B (zh) * 2021-04-15 2023-10-31 厦门亿联网络技术股份有限公司 一种会议录制文件的网盘调度同步方法及系统
EP4113334A1 (en) 2021-06-29 2023-01-04 Nect GmbH Method and system for automatic proofing of a remote recording
WO2024042366A1 (en) * 2022-08-23 2024-02-29 PXL Vision AG Injection attack prevention for digital identity verification
WO2024054549A1 (en) * 2022-09-08 2024-03-14 Microchip Technology Incorporated Coding data into a handwritten sample

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19901881A1 (de) 1999-01-19 2000-07-27 Dcs Dialog Communication Syste Verfahren und System zur Fälschungssicherung bei biometrischer Personenerkennung
US10395018B2 (en) * 2010-11-29 2019-08-27 Biocatch Ltd. System, method, and device of detecting identity of a user and authenticating a user
US9430627B2 (en) * 2014-03-05 2016-08-30 Werner Blessing Method and system for enforced biometric authentication
WO2015163774A1 (en) * 2014-04-24 2015-10-29 Igor Muttik Methods and apparatus to enhance security of authentication
US9858403B2 (en) 2016-02-02 2018-01-02 Qualcomm Incorporated Liveness determination based on sensor signals

Also Published As

Publication number Publication date
EP3575993B1 (en) 2022-01-26
EP3575993A1 (en) 2019-12-04

Similar Documents

Publication Publication Date Title
ES2908284T3 (es) Método y sistema para validar la identificación en vivo a distancia mediante grabación vídeo
EP3807792B1 (en) Authenticating an identity of a person
CN108804884B (zh) 身份认证的方法、装置及计算机存储介质
ES2812881T3 (es) Determinación de la señal en vivo basándose en señales del sensor
US9430627B2 (en) Method and system for enforced biometric authentication
US20160135719A1 (en) Hearing test system
US10331291B1 (en) Visual verification of digital identifications
KR20180050968A (ko) 온라인 시험 관리 방법
JP2011215942A (ja) ユーザ認証装置、ユーザ認証システム、ユーザ認証方法及びプログラム
KR101546391B1 (ko) 테스트 부정행위 감시 방법 및 시스템
CN113505652B (zh) 活体检测方法、装置、电子设备和存储介质
Amerini et al. Robust smartphone fingerprint by mixing device sensors features for mobile strong authentication
JP2007193656A (ja) 本人認証装置
ES2890857T3 (es) Método y sistema de verificación en tiempo real de un registro
Huang et al. Notification privacy protection via unobtrusive gripping hand verification using media sounds
WO2018168157A1 (ja) 情報処理装置および情報処理方法
Carta et al. Video injection attacks on remote digital identity verification solution using face recognition
US11893098B2 (en) Authenticating a user subvocalizing a displayed text
WO2022231702A1 (en) Integrating and detecting visual data security token in data via graphics processing circuitry using a frame buffer
US20220272131A1 (en) Method, electronic device and system for generating record of telemedicine service
CN110162949B (zh) 控制图像显示的方法及装置
WO2016095680A1 (zh) 隐私数据的入侵检测方法和装置
CN107959669B (zh) 手持行动通讯装置的密码验证方法
Wang et al. Protecting smartphone screen notification privacy by verifying the gripping hand
EP4113334A1 (en) Method and system for automatic proofing of a remote recording