MXPA04006390A - Creacion de depositos de datos en tiempo real. - Google Patents

Creacion de depositos de datos en tiempo real.

Info

Publication number
MXPA04006390A
MXPA04006390A MXPA04006390A MXPA04006390A MXPA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A
Authority
MX
Mexico
Prior art keywords
data
records
record
readable medium
relationship
Prior art date
Application number
MXPA04006390A
Other languages
English (en)
Inventor
James Jonas Jeffrey
Original Assignee
James Jonas Jeffrey
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by James Jonas Jeffrey filed Critical James Jonas Jeffrey
Publication of MXPA04006390A publication Critical patent/MXPA04006390A/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Abstract

Se describen un metodo y sistema para procesar datos a y en una base de datos (16) y para recuperar los datos procesados. Los datos comprenden identificadores de una pluralidad de entidades (18). El metodo y sistema comprenden: a) procesar datos a y en una base de datos (16), (b) mejorar los datos recibidos (20) antes de almacenarse en una base de datos (16), (c) determinar y comparar registros basandose en relaciones entre los registros en los datos recibidos (20) produciendo datos sin perdida de datos, (d) habilitar alertas basandose en reglas y relaciones de alerta definidas por el usuario. (e) detener automaticamente comparaciones adicionales y separar las previamente comparadas cuando los identificadores usados para comparar registros son posteriormente determinados como comunes a traves de entidades y no generalmente caracteristico de una entidad, (f) recibir consultas de datos (48) para recuperar los datos procesados almacenados en la base de datos (16), (g) utilizar el mismo algoritmo para procesar las consultas (46), y (h) transferir los datos procesados a otra base de datos que utilice el mismo algoritmo.

Description

CREACION DE DEPOSITOS DE DATOS EN TIEMPO REAL REFERENCIA CRUZADA A LAS SOLICITUDES RELACIONADAS La presente solicitud reclama el beneficio de la solicitud provisional No. 60/344,067, presentada en la oficina de patentes de Estados Unidos el 28 de Diciembre del 2001.
FEDERALMENTE AUSPICIADA O EN DESARROLLO No Aplicable.
CAMPO TECNICO Esta invención se refiere a un método, programa y sistema para procesar y recuperar datos en una creación de depósitos de datos y, más particularmente, a un método, programa y sistema para el procesamiento de datos a y en una creación de depósitos de datos, a la consulta de datos en una creación de depósitos de datos, y al análisis de los datos en una creación de depósitos de datos.
ANTECEDENTES DE LA INVENCION Las creaciones de depósitos de datos son bases de datos a base de computadora diseñadas para almacenar registros y responder a consultas o preguntas generalmente de múltiples fuentes. Los recursos corresponden con entidades, tales como individuos, organizaciones y propiedades. Cada registro contiene identificadores de la entidad, tal como, por ejemplo, nombre, dirección o información de cuenta para un individuo. Desafortunadamente, la efectividad de los sistemas de creación de depósitos de datos actuales se está disminuyendo debido a ciertas limitaciones que crean, perpetúan y/o incrementan cjerta calidad de datos, integridad y emisiones de funcionamiento. Dichas limitación también incrementan el riesgo, costo y tiempo requeridos para implementar, corregir y mantener tales sistemas. Las emisiones y limitaciones incluyen, sin limitación, las siguiente: (a) retos asociados con formatos de diferencia o de conflicto que emanan de las varias fuentes de datos, (b) datos incompletos a base de información faltante en cuanto se reciben, (c) múltiples registros introducidos que reflejan la misma entidad basándose en (por lo regular menos) discrepancias o mala ortografía, (d) capacidad insuficiente para identificar si múltiples registros están reflejando la misma entidad y/o si existe alguna relación entre los múltiples registros, (e) datos perdidos cuando dos registros determinados reflejan la misma entidad y emergen o un registro se desecha, (f) insuficiente capacidad para separar posteriormente registros cuando los registros que surgen son determinados posteriormente para reflejar dos entidades separadas, (g) capacidad insuficiente para emitir alertas basándose en reglas de alerta definidas por el usuario en tiempo real, (h) resultados inadecuados de consultas o preguntas que utilizan diferentes algoritmos o procedimientos de conversión que los algoritmos o procedimientos de conversión utilizados para procesar datos recibidos, y (i) incapacidad para mantener una consulta persistente de acuerdo con un criterio predeterminado, tal como durante cierto periodo de tiempo. Por ejemplo, cuando los identificadores de un individuo son recibidos y almacenados en una base de datos: (a) los registros de una fuente pueden hacerse disponibles en un formato delimitado con una coma, mientras que los registros de otra fuente pueden ser recibidos en otro formato de datos; (b) los datos de varios registros pueden estar faltantes, tales como un número telefónico, dirección, o alguna otra información de identificación; o (c) dos registros que reflejan al mismo individuo pueden ser recibidos en forma desconocida ya que un registro corresponde a un nombre real y otro registro corresponde a un nombre de soltero. En la última situación, el sistema puede determinar que los dos registros tienen que ser unidos o que un registro (tal vez que emana de una fuente menos confiable) sea desechado. Sin embargo, en el procedimiento de unión, los sistemas actuales típicamente abandonan datos, lo cual niega la habilidad para separar posteriormente los dos registros si se determina que los registros reflejan dos entidades separadas. Además, cuando los identificadores son recibidos y almacenados en la base de datos, la computadora puede realizar procedimientos de transformación y de mejora antes de cargar los datos a la base de datos. Sin embargo, las herramientas de consulta de sistemas actuales utilizan pocos, si hay alguno, de los procedimientos de transformación de y de mejora usados para recibir y procesar los datos recibidos, haciendo que cualesquiera resultados de tales consultas sean inconsistentes, y por lo tanto, inadecuados, insuficientes y potencialmente falsos. Similarmente, los sistemas de creación de depósitos de datos actuales no tienen las herramientas necesarias para identificar totalmente la relación entre entidades, o determinar si dichas entidades reflejan o no la misma entidad en tiempo real. Por ejemplo, un individuo puede tener la misma dirección de un segundo individuo y el segundo individuo puede tener el mismo número telefónico de un tercer individuo. En tales circunstancias, podría ser benéfico determinar la probabilidad de que el primer individuo tuviera cierta relación con el tercer individuo, especialmente en tiempo real. Además, los sistemas de creación de depósitos de datos actuales tienen la habilidad limitada para identificar relaciones inapropiadas o de conflicto entre entidades y proporcionan alertas en reglas de alerta definidas por el usuario basándose en tiempo real. Dicha habilidad limitada se basa en varios factores, incluyendo, sin limitación, la incapacidad de identificar eficiente relaciones como se indicó antes. Además, los sistemas de creación de depósitos de datos actuales primero no pueden transformar y mejorar un registro y después mantener una consulta persistente durante un periodo predeterminado. Una consulta persistente podría ser benéfica en varias circunstancias, incluyendo, sin limitación, en casos en donde el nombre de una persona sea identificado en una investigación criminal. Una consulta para identificar cualesquiera comparaciones que corresponden con la persona inicialmente puede invertirse sin ningún resultado y los datos consultados en los sistemas actuales esencialmente son desechados. Sin embargo, podría ser benéfico cargar la consulta de la misma manera como los datos recibidos, en donde los datos consultados pueden ser usados para hacer comparar con otros datos o consultas recibidas y proporcionar una mejor base para los resultados. Como tales, cualquiera o todas las emisiones y limitaciones (si se identifican aquí o no) de sistemas de creación de depósitos de datos actuales disminuye la exactitud, confiabilidad y puntualidad de la creación de depósitos de datos y dramática impide el funcionamiento. En realidad, la utilización de dichas emisiones puede ocasionar resultados inadecuados y decisiones incorrectas basándose en tales resultados. La presente invención está provista para dirigir estas y otras emisiones.
COMPENDIO DE LA INVENCION Es un objeto de la invención proporcionar un método, programa y sistema para procesar datos a y en una base de datos. El método preferiblemente comprende los pasos de: (a) recibir datos para una pluralidad de entidades, (b) utilizar un algoritmo para procesar los datos recibidos, (c) almacenar los datos procesados en la base de datos, (d) recibir consultas de datos para recuperar los datos almacenados en la base de datos, y (e) utilizar los mismos algoritmos para procesar las consultas. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, propiedades, organizaciones, proteínas u otras cosas que puedan ser representadas identificando datos. El algoritmo incluye recibir datos que han sido convertidos a un formato de mensaje estandarizado y retiene la atribución de los identificadores, tales como un sistema fuente, el valor único del sistema fuente para el identificador, un sistema de consulta y/o usuario. El procedimiento de algoritmo incluye analizar los datos antes de almacenar o consultar en la base de datos, en donde dicho paso de análisis puede incluir: (a) comparar uno o más identificadores contra un criterio definido por el usuario o uno o más grupos de datos en una base de datos, lista, u otro formato electrónico, (b) formatear el identificador de acuerdo con estándar definido por el usuario, (c) mejorar los datos antes de almacenar o consultar, consultando uno o más grupos de datos en otras bases de datos (las cuales pueden tener el mismo algoritmo como la primera base de datos y continúan buscando en una forma de cascada) o listas para identificadores adicionales para suplementar los datos recibidos con cualquier identificador adicional, (d) crear claves parásitas para los identificadores, y (d) almacenar consultas procesadas basándose en el criterio definido por el usuario, tal como un periodo especificado de tiempo. Además se contempla que el método, programa y sistema pueden incluir: (a) utilizar un algoritmo para procesador datos y comparar registros, en donde el procedimiento de algoritmo podría: (i) recuperar de la base de dados, un grupo de registros incluyendo identificadores similares a los identificadores en los datos recibidos, (ii) analizar el grupo de registros recuperado para una comparación con los datos recibidos, (¡ii) comparar los datos recibidos con los registros recibidos que son determinados para reflejar la misma entidad, (iv) analizar si cualquiera de los modos identificadores fueron agregados a cualquier registro comparado, y (v) volver a buscar los otros registros del grupo recuperado de registros para comparar con cualquier registro comparado, y (b) almacenar los registros comparados en la base de datos. Además, el algoritmo puede incluir: (a) recuperar de la base de datos, un grupo adicional de registros incluyendo identificadores similares a los identificadores en el registro comparado, (b) repetir los pasos de recuperar los registros, analizar comparaciones, comparar los mismos registros de entidad, analizar nuevos identificadores, y volver a buscar registros recuperados hasta que nos encuentren comparaciones adicionales, y (c) asignar una clave persistente a los registros. Dichos procedimientos pueden ser realizados en lote o en tiempo real. Además se contempla que el método, programa y sistema incluyen determinar si un identif icador particular es común a través de las entidades o generalmente distinto para una entidad, y separar registros previamente comparados si el identificador particular utilizado para comparar los registros es posteriormente determinado como entidades cruzadas comunes y generalmente distintivas de una entidad. Dichos pasos de determinación y separación pueden ser realizados en tiempo real o forma intermitente. Los pasos de determinación y separación pueden incluir detener cualesquiera comparaciones adicionales basándose en un identificador que se determina como una entidad cruzada común y generalmente no distintiva de una entidad, así como volver a procesar cualquier registro separado. Además se contempla que los datos recibidos son comparados con por lo menos otro registro previamente almacenado para determinar la existencia de una relación entre las entidades, y que un registro de relación se crea para cada dos entidades para las cuales existe una relación. El registro de relación puede incluir un indicador(es) de confidencia, Indicando la probabilidad de una relación entre las dos entidades o la probabilidad de que las dos identidades sean iguales. El registro de relación también puede hacer referencia a papeles de las entidades que son incluidos en los datos recibidos o asignados. Los registros de relación son analizados para determinar la existencia de cualesquiera registros relacionados previamente desconocidos basándose en la existencia de un criterio definido por el usuario. Los registros de relación reflejan un primer grado de separación, la cual puede ser analizada y navegada para incluir solamente aquellos registros que satisfacen 'un criterio predeterminado, tal como un número máximo de grados de prueba de separación o un nivel mínimo de la relación y/o indicadores de confidencia de similitud. Se puede emitir una alerta identificando el grupo de registros relacionados basándose en una regla de alerta definida por el usuario. La alerta puede ser comunicada a través de varios medios de comunicación electrónicos, tales como un mensaje de correo electrónico, una llamada telefónica, un asistente digital personal, o un mensaje de sonido corto. Además se contempla que el método puede incluir: (a) duplicar los registros de relación en una o más bases de datos, (b) distribuir los datos recibidos a una o más de las bases de datos adicionales para análisis basándose en los criterios de carga de trabajo; y (c) emitir cualquier alerta de las bases de datos adicionales. Además se contempla que el método y sistema podrían incluir transferir los datos almacenados a otra base de datos que utiliza el mismo algoritmo como la primera base de datos. Los pasos de procesar y transferir pueden ser realizados en tiempo real o en forma intermitente. Estos y otros aspectos y atributos de la presente invención serán discutidos con referencia a los siguientes dibujos y la especificación anexa.
BREVE DESCRIPCION DE LOS DIBUJOS La Figura 1 es un diagrama de bloque de un sistema de acuerdo con la presente invención; La Figura 2 es un diagrama de flujo para procesar datos en el bloque de sistema en la Figura 1; Las Figuras 3A-3C son un diagrama de flujo del bloque de Algoritmo de Procesamiento en la Figura 2; y Las Figuras 4A-4B son un diagrama de flujo de un bloque de Evaluar Registro Analizado Almacenado, en la Figura 3.
DESCRIPCION DETALLADA DE LA INVENCION Aunque esta invención es susceptible de modalidades en muchas diferentes formas, se muestra en los dibujos, y se describirá aquí con detalle, sus modalidades específicas con el entendimiento de que la presente descripción debe ser considerada como una ilustración de los principios de la invención y no pretende limitar la invención a las modalidad específicas ilustradas. Un sistema de procesamiento de datos 10 para procesar datos a y en una base de datos para recuperar 'los datos procesados se ilustra en las Figuras 1-4B. El sistema 10 incluye por lo menos una computadora convencional 12 que tiene un procesador 14 y una memoria 16. La memoria 16 se utiliza para almacenar software ejecutable para hacer operar el sistema 10, así como para almacenar los datos en una base de datos y memoria de acceso aleatorio. Sin embargo, el software puede ser almacenado o provisto en cualquier otro medio legible por computadora, tal como un CD, DVD, o disco flexible. La computadora 12 puede recibir entradas de una pluralidad de fuentes 18r 18n. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, organizaciones, propiedades, proteínas, compuestos químicos u orgánicos, estructuras biométricas o atómicas, u otras cosas que puedan ser representadas identificando datos. Los identificadores para una entidad de tipo individual pueden incluir el nombre del individuo, direcciones, números telefónicos, números de tarjeta de crédito, número de seguro social, información de empleo, viajero frecuente u otro programa de constancia, o información de cuentas. Los identificadores generalmente distintivos son aquellos que son distintivos para una entidad específica, tales como un número de seguro social para una entidad de individuo. El sistema 10 recibe los datos de la pluralidad de fuentes 18r 18n y utiliza un algoritmo 22 para procesar los datos recibidos 20. El algoritmo está almacenado en la memoria 16 y es procesado o ¡mplementado por el procesador 14.
Los datos recibidos 20 que incluyen, sin limitación, atribuciones de los datos recibidos (por ejemplo, identificación del sistema fuente), probablemente son recibidos en muchos formatos de datos. Antes de ser procesador por el algoritmo 22, los datos recibidos 20 son convertidos a un formato de mensaje estandarizado 24, tal como el Formato de Mensaje Universal. Después, como se ilustra en las Figuras 3A-3C, el algoritmo 22 recibe los datos estandarizados 26 y analiza, 28, los datos recibidos 26 antes del almacenamiento o consulta en la base de datos: (a) comparando los datos recibidos 26 con criterios o reglas definidas por el usuario para realizar varias funciones, incluyendo, sin limitación, las siguientes: (i) estandarización de nombre 30 (por ejemplo, comparando con una lista raíz de nombres), (ii) higiene de dirección 32 (por ejemplo, comparando con códigos postales de entrega), (iii) prueba o transformaciones de campo 34 (por ejemplo, comparando el campo de género para configurar M/F o transformar masculino a M, etc.) (iv) formateo definido por el usuario 36 (por ejemplo, formateo de todos los números de seguro social en un formato de 999-99-9999), (b) mejorando los datos 38 haciendo que el sistema 10 tenga acceso a una o más bases de datos 40 (las cuales pueden contener el mismo algoritmo como el de la primera base de datos, haciendo de esta manera que el sistema tenga acceso a bases de datos adicionales en una forma de cascada) para buscar información adicional (la cual puede ser emitida como datos recibidos 20), que pueden suplementar 42 los datos recibidos 26, y (c) construir claves parásitas de los datos analizados 44. Cualesquiera datos nuevos, modificados o mejorados pueden ser almacenados en campos recientemente creados para mantener la integridad de los datos originales. Por ejemplo, si el nombre "Bobby Smith" es recibido en un formato estandarizado 26, en nombre "Bobby" puede ser comparado con una lista raíz de nombres 30, estandarizado al nombre "Robert" y guardado en un campo recientemente creado para el nombre estándar. Además, si el nombre y la dirección para Bobby Smith son recibidos, 26, el sistema 10 puede tener acceso a una base de datos para encontrar personas 40 a base de Internet, convencional, para obtener el número telefónico de Bobby Smith, el cual después puede ser formateado en una forma estándar basándose en criterios definidos por el usuario 36. Además, el campo de dirección puede ser comparado con una lista de direcciones 32, dando como resultado el texto "calle" agregado al final de la dirección estandarizada. Después, se desarrollan, 44, claves parásitas basándose en los datos mejorados y almacenados en campos recientemente creados. El sistema 10 también recibe consultas 46 de la pluralidad de fuentes 18r18n y utiliza el mismo algoritmo 22 para analizar y procesar las consultas recibidas 46. Por ejemplo, si se recibe, 46, una consulta para "Bobby Smith", el mismo algoritmo 22 que estandarizó el nombre recibido de "Bobby" al nombre "Robert", también estandarizará al nombre consultado o solicitado de "Bobby" al nombre consultado o solicitado "Robert". En realidad, el sistema 10 carga y almacena consultas recibidas 46 igual que los datos recibidos 20, manteniendo la total distribución del sistema de consultas y usuario. Como tal, ya que el sistema 10 procesa las consultas recibidas 46, el algoritmo 22 puede buscar otras bases de datos 40, tales como la base de datos de registros públicos, para encontrar información faltante. Los resultados de consulta 94 pueden ser más amplios que comparaciones exactas, y pueden incluir comparaciones de relación. Por ejemplo, si la consulta es para "Bobby Smith", los resultados de consulta 94 pueden incluir registros de personas quienes han utilizado la tarjeta de crédito de Bobby Smith, o han vivido en la dirección de Bobby Smith. El algoritmo 22 también realiza una función después de recibir cualesquiera datos recibidos 26 para: (a) determinar si hay un registro existente en la base de datos que se compare con la entidad que corresponde a dichos datos recibidos, y (b) si es así, igualar los datos recibidos con el registro existente. Por ejemplo, el algoritmo recupera un grupo de registros 48 (incluyendo identificadores similares a los identificadores en los datos recibidos) de la base de datos para posibles candidatos y analiza el grupo de registros recuperados para una comparación 50 identificando un registro almacenado existente correspondiendo a los datos recibidos basándose en identificadores 52 generalmente distintivos. Si se identifica, 54, una comparación, el algoritmo analiza si el registro comparado contiene cualesquiera identificadores 56 nuevos o previamente desconocidos. Si hay identificadores 56 nuevos o previamente desconocidos, el algoritmo 22 puede analizar los ¡dentificadores 58 nuevos o previamente desconocidos, agregar o actualizar los registros de lista/relación candidatos 70 basándose en los ¡dentificadores nuevos o previamente desconocidos en el registro comparado, y determinan si existen cualesquiera comparaciones adicionales 50. Este procedimiento es repetido hasta que no se perciben comparaciones adicionales. El procedimiento de comparación después puede asignar todos los registros comparados con la misma clave persistente 60. Además, si no se encuentra ninguna comparación para algún registro, el registro sin comparación se le puede asignar su propia clave persistente 62. Los registros retienen una total atribución de los datos y el procedimiento de comparación no pierde ningún dato a través de una función de unión, purga o eliminación. Por ejemplo, si el registro #1 tiene un nombre de individuo, número telefónico y dirección, y el registro #2 tiene el mismo nombre y un número de tarjeta de crédito. Uno no sabe si son o no los mismos individuos, de manera que los registros deben ser mantenidos por separado. Después, los datos para el registro #3 son recibidos, incluyendo el nombre del individuo (igual al registro #1), dirección (igual al registro #1), número telefónico (mismo registro #1) y número de tarjeta de crédito. Ya que el nombre, número telefónico y dirección para #1 y #3 coinciden, el sistema 10 puede determinar que #1 y #3 están describiendo al mismo individuo, de manera que el algoritmo compara el registro #1 con los datos #3. El sistema 10 vuelve a correr después del algoritmo, comparando el registro comparado #1 con los otros registros de la lista de candidatos o registros adicionales que incluyen identificadores similares al registro comparado. Ya que el nombre y número de tarjeta de crédito del registro #1 comparado coincide con el nombre y el número de tarjeta de crédito del registro #2 estos dos registros también son comparados. Este registro comparado después es corrido de nuevo contra la lista de candidatos o registro adicionales recuperados buscando comparaciones 54 hasta que no se obtiene ninguna comparación. En ocasiones, el sistema 10 puede determinar que dos registros fueron incorrectamente igualados. Por ejemplo, los números de seguro social son considerados generalmente identificadores distintivos para individuos, y de esta manera los registros por lo regular coinciden basándose con el mismo número de seguro social. Sin embargo, es posible que dicho número, en ciertas circunstancias, sea determinado posteriormente como entidades cruzadas comunes y no generalmente distintivos de una entidad. Por ejemplo, considerar una operación de entrada de datos teniendo un campo de registro para números de seguro social como un campo requerido, pero el operador de entrada de datos quien no sabe el número de seguro social de los individuos meramente introduce el número "123-45-6789" para cada individuo. En tal caso, el número de seguro social podría ser un cruce común de dichas entidades de tipo individuales y ya no más ser un identif icador generalmente distintivo para estos individuos. Por consiguiente: (a) el identificador común ahora conocido puede ser agregado a una lista de identificadores comunes y todos los procedimientos futuros no intentarán recuperar registros para lista de candidatos o crear registros de relación 70 basándose en el identificador común ahora conocido, deteniendo así cualesquiera comparaciones futuras 64, y (b) cualquier registro que se igualará basándose con el número de seguro social erróneo puede necesitar ser separado para reflejar los datos antes de la comparación, requiriendo asi de ninguna pérdida de datos anteriores. Para lograr el último objetivo el sistema 10 separa cualesquiera comparaciones que ocurrieron basándose en las suposiciones incorrectas 66 con el punto antes de la suposición incorrecta de acuerdo con toda la distribución de los datos, sin ninguna pérdida de datos. De esta manera, si el registro #1 para "Bobby Smith" (el cual ha sido estandarizado a "Robert Smith") ha sido igualado con el registro #2 para "Robert Smith", y finalmente se determina que estos dos diferentes individuos, y que necesitan ser separados en los registros originales #1 y 2, el algoritmo puede identificar que el "Robert Smith está estandarizado del registro #1 era conocido como "Bobby". Además, los pasos de determinación y separación pueden ser realizados en tiempo real o en forma intermitente. Además, los registros separados pueden volver ha ser presentados como datos nuevos recibidos que serán procesados en el sistema. Existen también algunas veces cuando las relaciones, aún menores que relaciones obvias, necesitan ser evaluadas, 68. Por ejemplo, los individuos #1 y #2 cada uno puede tener una relación como una organización #3. De esta manera, es posible, tal vez probablemente, que exista una relación entre los individuos #1 y #2. Las relaciones pueden ser extendidas a varios grados de separación. Por consiguiente, el sistema 10 compara todos los datos recibidos con todos los registros en los datos recibidos y crea un registro de relación 70 para cada par de registros para los cuales existe alguna relación entre las entidades respectivas. El registro de relación 70 puede incluir tipos de relación (por ejemplo, padre, co-conspirador), los identif icadores de confidencia (los cuales son clasificaciones indicando la resistencia de relación de las dos entidades) 72 y la clave persistente asignada 60 o 62. Por ejemplo, los indicadores de confidencia 72 pueden incluir una clasificación de relación y una clasificación de similitud. La clasificación de relación es un indicador, tal como entre uno y 10, representando la probabilidad de que existe una relación entre el individuo #1 y el individuo #2. La clasificación de similitud también es un indicador, tal como entre 1 y 10, de que el individuo #1 es la misma persona que el individuo #2. Los indicadores de confidencia 72 pueden ser identificados durante el procedimiento de comparación descrito anteriormente. El sistema 10 también analiza los datos recibidos 20 y consultas 46 para determinar la existencia de una condición que satisfaga los criterios de una regla de alerta 74 definida por el usuario, tal como una relación inapropiada entre dos entidades o cierto patrón de actividades basándose en registros de relación que tienen un indicador de confidencia mayor que un . valor predeterminado y/o que tienen un registro de relación menor que un número predeterminado de grados de separación. Por ejemplo, el sistema 10 puede incluir una lista de tarjetas de crédito fraudulentas que pueden ser utilizadas para determinar si cualesquiera datos recibidos o consultas contienen un número de tarjeta de crédito que está en la lista de números de tarjeta de crédito fraudulentas. Además, la regla de alerta 74 definida por el usuario puede hacer que los datos recibidos y las consultas sean reportados. Por ejemplo, una regla de alerta puede existir si, después de introducir los datos de un nuevo vendedor, se determinó que el nuevo vendedor tenía la misma dirección a la de un empleado actual, indicando una relación entre el vendedor y el empleado que tal vez el empleado podría ser investigado. Después de la determinación de una situación- que podría activar la regla de alerta definida por el usuario, el sistema 10 emite una alerta 74, la cual puede ser comunicada a través de varios medios, tales como un mensaje a través de un correo electrónico o a un dispositivo de comunicación portátil, tal como un localizador alfanumérico, asiste digital personal o un teléfono. Por ejemplo, basándose en la regla de alerta definida por el usuario para todos los registros que tienen una probabilidad de indicador de confidencia de relación mayor que 7, 76, a un máximo de separación 78, el sistema 10: (a) iniciará con el individuo #1, (b) encontrará todos los otros individuos 80 relacionados con #1 teniendo un indicador de confidencia mayor que siete 76, (c) analizará todos los primeros grados de individuos de separación 80, y determinará a todos los individuos 82 relacionados con el primer grado de individuos de separación 80 teniendo un indicador de confidencia mayor que siete 84, y (d) repetirá el procedimiento hasta que satisfaga los 6 grados del parámetro de separación 78. El sistema podría enviar electrónicamente una alerta (que puede incluir todos los registros resultantes basándose en un criterio definido por el usuario) al sistema individual o separado relevante permitiendo una acción adicional. Además, los registros de relación 70 pueden ser duplicados a través de varias bases de datos. Al recibirlos datos recibidos 20, el sistema sistemáticamente puede evaluar la naturaleza de la carga de trabajo de cada una de las otras bases de datos y distribuir los registros comparados/relacionados/analizados a la base de datos muy probablemente para analizar de forma eficiente el registro analizado almacenado 68. Después, se pueden emitir cualesquiera alertas 74 de cualquiera de los resultados que emanan de las otras bases de datos. Finalmente, los datos procesador pueden ser transferidos, 88, a bases de datos adicionales basándose en una lista de publicación de creación de depósitos de datos 86 en cascada que puede utilizar el mismo algoritmo 92, ya sea en un procedimiento en tiempo real o intermitente. De esta manera, los datos transferidos 88 después pueden ser utilizados para compararse con datos (los cuales pueden incluir diferentes datos) en las bases de datos adicionales y cualquier base de datos subsecuente para identificar relaciones, comparaciones o procesamiento de dichos datos. Por ejemplo, los registros comparados a base de los indicadores de confidencia en una base de datos local pueden ser transferidos, 88, a la base de datos regional que será comparada e igualada con datos utilizando el mismo algoritmo 92. Después, los datos procesados que resultan de la base de datos regional pueden ser transferidos, 88, a la oficina nacional. Al combinar los datos procesados en cada paso, especialmente en tiempo real, las organizaciones o usuarios de sistemas pueden ser capaces de determinar datos inapropiados o de conflicto incitando a una acción adicional. Se puede utilizar un código de software convencional para implementar los aspectos funcionales del método, programa y sistema descritos anteriormente. El código puede ser colocado en un medio legible por computadora para utilizarse por una sola computadora o una red distribuida de computadoras, tal como el Internet. A partir de lo anterior, se observará que se pueden efectuar numerosas variaciones y modificaciones sin apartarse el espíritu y alcance de la invención. Se debe entender que no se pretende aquí o se infiere ninguna limitación con respecto al aparato especifico ilustrado. Claro que, se pretenden cubrir, a través de las reivindicaciones anexas, todas estas modificaciones para que caigan dentro del alcance de las reivindicaciones.

Claims (1)

  1. REIVINDICACIONES 1. - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas o preguntas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 2. - El método de acuerdo con la reivindicación 1, en donde las entidades son personas. 3.- El método de acuerdo con la reivindicación 1, en donde las entidades son propiedades personales. 4. - El método de acuerdo con la reivindicación 3, en donde la propiedad personal son vehículos. 5. - El método de acuerdo con la reivindicación 1, en donde las entidades son bienes raíces. 6. - El método de acuerdo con la reivindicación 1, en donde las entidades son organizaciones. 7. - El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos químicos. 8.- El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos orgánicos. 9. - El método de acuerdo con la reivindicación 1, en donde las entidades son proteínas. 10. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras biológicas. 11. - El método de acuerdo con la reivindicación 1, en donde las entidades son valores biométricos. 12. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras atómicas. 13.- El método de acuerdo con la reivindicación 1, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 14. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 15. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identlficador único representando cada registro en el sistema fuente. 16. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 17.- El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos. 18.- El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 19. - El método de acuerdo con la reivindicación 18, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 20. - El método de acuerdo con la reivindicación 18, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 21.- El método de acuerdo con la reivindicación 18, en donde el paso de comparar por lo menos uno de los identif icadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 22.- El método de acuerdo con la reivindicación 18, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base dé datos, incluye mejorar los datos recibidos. 23.- El método de acuerdo con la reivindicación 22, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 24.- El método de acuerdo con la reivindicación 23, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identif icadores recibidos; y suplementar los datos recibidos con los identif icadores adicionales localizados en la base de datos secundaria. 25. - El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásito de los identificadores. 26. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 27. - El método de acuerdo con la reivindicación 26, en donde el criterio definido por el usuario incluye una fecha de expiración. 28. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 29. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 30.- El método de acuerdo con la reivindicación 1 o 17, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identif icador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para una comparación con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 31.- El método de acuerdo con la reivindicación 30, en donde la comparación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 32.- El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 33. - El método de acuerdo con la reivindicación 32, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 34. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 35. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 36. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 37. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y separar registros que fueron previamente igualados, se realizan en tiempo real. 38. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 39. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 40. - El método de acuerdo con la reivindicación 39, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 41. - El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 42.- El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 43.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 44.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 45. - El método de acuerdo con la reivindicación 40, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 46. - El método de acuerdo con la reivindicación 45, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 47. - El método de acuerdo con la reivindicación 46, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 48. - El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 49.- El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 50.- El método de acuerdo con la reivindicación 45, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 51. - El método de acuerdo con la reivindicación 50, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 52. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 53. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicación electrónicos comprenden un teléfono. 54. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un localizador. 55. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 56. - El método de acuerdo con la reivindicación 50, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria . 57. - El método de acuerdo con las reivindicaciones 1 o 28, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 58. - El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 59.- El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 60 - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identif icadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada ¡dentificador del grupo recuperado de registros para realizar una comparación con: por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que- tiene ¡dentificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 61.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye asignar una clave persistente. 62. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen ¡dentificadores similares a los ¡dentificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada ¡dentificador del grupo recuperado de registros para una comparación. 63. - El método de acuerdo con la reivindicación 60 o 62, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identif icador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identif icador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identif icador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 64.- El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 65. - El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 66. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 67.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 68.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 69. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente igualados, se realizan en tiempo real. 70. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente igualados, se realizan en forma intermitente. 71.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 72.- El método de acuerdo con la reivindicación 71, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 73.- El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 74. - El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 75. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 76. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 77. - El método de acuerdo con la reivindicación 72, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 78.- El método de acuerdo con la reivindicación 77, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 79. - El método de acuerdo con la reivindicación 78, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 80. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 81. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 82. - El método de acuerdo con la reivindicación 77, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 83. - El método de acuerdo con la reivindicación 82, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 84. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 85. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicación electrónicos comprenden un teléfono. 86. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un localizador. 87. - El método de acuerdo con la rei indicación 83, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 88. - El método de acuerdo con la reivindicación 82, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 89. - El método de acuerdo con las reivindicaciones 60, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 90. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identif icadores. 91. - El método de acuerdo con la reivindicación 90, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identificador único representando cada registro en el sistema fuente. 92.- El método de acuerdo con la reivindicación 90, en donde el paso de retener una atribución de cada uno de los identif icadores incluye retener una identidad de un sistema de consulta y un usuario particular. 93. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 94. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 95.- El método de acuerdo con la reivindicación 94, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 96. - El método de acuerdo con la reivindicación 94, en donde el ¡dentificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 97. - El método de acuerdo con la reivindicación 94, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un ¡dentificador de acuerdo con el criterio definido por el usuario. 98. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 99. - El método de acuerdo con la reivindicación 98, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 100. - El método de acuerdo con la reivindicación 99, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en la base de datos secundaria. 101. - El método de acuerdo con la reivindicación 93, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 102. - El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 103.- El método de acuerdo con la reivindicación 102, en donde el criterio definido por el usuario incluye una fecha de expiración. 104.- El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 105. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 106. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 107. - Un método para separar registros previamente comparados, el método comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 108.- El método de acuerdo con la reivindicación 107, que comprende además prohibir cualesquiera comapraciones adicionales de registros basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 109.- El método de acuerdo con la reivindicación 107, que comprende además el paso de volver a procesar los registros separados. 110. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron igualados, se realizan en tiempo real. 111. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente igualados, se realizan en forma intermitente. 112.- Un registro para procesar datos en una base de datos, el método comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 113.- El método de acuerdo con la reivindicación 112, que comprende además el paso de crear por lo menos un identificador de confidencia para cada registro de relación en tiempo real. 114.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 115.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 116. - El método de acuerdo con las reivindicaciones 112 o 113, que comprende además el paso de analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 117. - El método de acuerdo con la reivindicación 116, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 118.- El método de acuerdo con la reivindicación 117, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 119.- El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 120. - El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 121. - El método de acuerdo con la reivindicación 116, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 122. - El método de acuerdo con la reivindicación 121, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 123. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 124. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicación electrónicos comprenden un teléfono. 125. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un localizador. 126. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 127. - El método de acuerdo con la reivindicación 121, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 128. - Para un sistema para procesar datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse a través de una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro de representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 129. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son personas. 130. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son propiedades personales. 131. - El medio legible por computadora de acuerdo con la reivindicación 130, en donde la propiedad personal son vehículos. 132- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son bienes raíces. 133.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son organizaciones. 134.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos químicos. 135.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos orgánicos. 136.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son proteínas. 137.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras biológicas. 138.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son valores biométricos. 139. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras atómicas. 140. - El medio legible por computadora de acuerdo con la reivindicación 128, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 141. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 142. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identif icador único representando cada registro en el sistema fuente. 143. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 144. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos.' 145. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 146.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 147.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 148. - El medio legible por computadora de acuerdo con la reivindicación 145, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 149. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 150. - El medio legible por computadora de acuerdo con la reivindicación 149, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 151.- El medio legible por computadora de acuerdo con la reivindicación 150, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los ¡dentificadores recibidos; y suplementar los datos recibidos con los ¡dentificadores adicionales localizados en una base de datos adicional. 152. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásitas de los ¡dentificadores. 153. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 154. - El medio legible por computadora de acuerdo con la reivindicación 153, en donde el criterio definido por el usuario incluye una fecha de expiración. 155. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 156. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 157.- El medio legible por computadora de acuerdo con la reivindicación 128 o 144, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para comparar con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 158.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde la igualación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 159.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 160.- El medio legible por computadora de acuerdo con la reivindicación 159, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 161.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 162. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 163. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 164. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separar registros que fueron previamente comparados, se realizan en tiempo real. 165.- El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 166.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 167.- El medio legible por computadora de acuerdo con la reivindicación 166, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 168. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 169. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 170. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 171.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son ¡guales. 172.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 173.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de analizar los registros de relación incluyen analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 174. - El medio legible por computadora de acuerdo con la reivindicación 173, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 175. - El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 176.- El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 177.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 178.- El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 179.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 180.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicación electrónicos comprenden un teléfono. 181. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un localizador. 182. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 183. - El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 184. - El medio legible por computadora de acuerdo con las reivindicaciones 128 o 155, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 185. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 186. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados, a por lo menos una base de datos secundaria se realiza en forma intermitente. 187. - Para un sistema para procesar datos a y en una base de datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identificadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identif icador del grupo recuperado de registros para realizar una comparación con. por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 188. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo para los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 189. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen identif icadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identif icador del grupo recuperado de registros para una comparación. 190. - El medio legible por computadora de acuerdo con la reivindicación 187 o 189, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 191. - El medio legible por computadora de acuerdo con la reivindicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 192. - El medio legible por computadora de acuerdo con la rei indicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 193. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 194. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 195. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 196. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente comparados, se realizan en tiempo real. 197. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 198. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 199.- El medio legible por computadora de acuerdo con la reivindicación 198, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 200.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 201. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 202. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 203. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 204.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 205.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 206. - El medio legible por computadora de acuerdo con la reivindicación 205, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 207. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 208. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 209.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 210.- El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 211. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 212. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicación electrónicos comprenden un teléfono. 213.- El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un localizador. 214. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 215. - El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 216. - El medio legible por computadora de acuerdo con las rei indicaciones 187, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 217. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identificadores . 218. - El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identif icador único representando cada registro en el sistema fuente. 219.- El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener una atribución de cada uno de los identificadores incluye retener una identidad de un sistema de consulta y un usuario particular. 220. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 221. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos y una lista . 222.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 223.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 224. - El medio legible por computadora de acuerdo con la reivindicación 221, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el criterio definido por el usuario. 225. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 226. - El medio legible por computadora de acuerdo con la reivindicación 225, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 227.- El medio legible por computadora de acuerdo con la reivindicación 226, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en por lo menos una base de datos adicional. 228.- El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 229. - El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 230. - El medio legible por computadora de acuerdo con la reivindicación 229, en donde el criterio definido por el usuario incluye una fecha de expiración. 231.- El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 232. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 233. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 234. - Para un sistema para separar registros previamente comparados, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 235. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además prohibir cualesquiera comparaciones adicionales de registros basándose en un identif ¡cador particular si el identif icador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 236. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además el paso de volver a procesar los registros separados. 237. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron comparados, se realizan en tiempo real. 238. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente comparados, se realizan en forma intermitente. 239.- Para un sistema para procesar datos en una base de datos, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identif icador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 240.- El medio legible por computadora de acuerdo con la reivindicación 239, que comprende además el paso de crear por lo menos un identif icador de confidencia para cada registro de relación en tiempo real. 241.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 242.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 243. - El medio legible por computadora de acuerdo con las reivindicaciones 239 o 240, que comprende además el paso de analizar los registro de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 244. - El medio legible por computadora de acuerdo con la reivindicación 243, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 245.- El medio legible por computadora de acuerdo con' la reivindicación 244, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 246.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 247.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 248.- El medio legible por computadora de acuerdo con la reivindicación 243, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 249.- El medio legible por computadora de acuerdo con la reivindicación 248, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 250.- El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 251. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicación electrónicos comprenden un teléfono. 252. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un localizador. 253. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 254.- El medio legible por computadora de acuerdo con la reivindicación 248, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria.
MXPA04006390A 2001-12-28 2002-12-27 Creacion de depositos de datos en tiempo real. MXPA04006390A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US34406701P 2001-12-28 2001-12-28
PCT/US2002/041630 WO2003058427A1 (en) 2001-12-28 2002-12-27 Real time data warehousing

Publications (1)

Publication Number Publication Date
MXPA04006390A true MXPA04006390A (es) 2005-06-08

Family

ID=23348900

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA04006390A MXPA04006390A (es) 2001-12-28 2002-12-27 Creacion de depositos de datos en tiempo real.

Country Status (14)

Country Link
US (2) US8452787B2 (es)
EP (1) EP1470475A4 (es)
JP (3) JP2006501529A (es)
KR (3) KR100850255B1 (es)
CN (2) CN101324902A (es)
AU (1) AU2002367376A1 (es)
BR (1) BR0215411A (es)
CA (1) CA2471940C (es)
EA (1) EA200400873A1 (es)
IL (1) IL162746A0 (es)
MX (1) MXPA04006390A (es)
PL (1) PL374305A1 (es)
WO (1) WO2003058427A1 (es)
ZA (1) ZA200405141B (es)

Families Citing this family (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100850255B1 (ko) 2001-12-28 2008-08-19 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징
US7200619B2 (en) * 2002-05-31 2007-04-03 International Business Machines Corporation Method and process to optimize correlation of replicated with extracted data from disparate data sources
US7900052B2 (en) 2002-11-06 2011-03-01 International Business Machines Corporation Confidential data sharing and anonymous entity resolution
US7346927B2 (en) 2002-12-12 2008-03-18 Access Business Group International Llc System and method for storing and accessing secure data
US8620937B2 (en) * 2002-12-27 2013-12-31 International Business Machines Corporation Real time data warehousing
WO2004061668A1 (en) 2002-12-31 2004-07-22 International Business Machines Corporation Authorized anonymous authentication
WO2004097596A2 (en) * 2003-03-24 2004-11-11 Systems Research & Development Secure coordinate identification method, system and program
US7069308B2 (en) * 2003-06-16 2006-06-27 Friendster, Inc. System, method and apparatus for connecting users in an online computer system based on their relationships within social networks
US7747638B1 (en) * 2003-11-20 2010-06-29 Yahoo! Inc. Techniques for selectively performing searches against data and providing search results
AR047362A1 (es) * 2003-12-31 2006-01-18 Thomson Global Resources Ag Sistemas, metodos, interfases y software para recoleccion automatizada e integracion de datos de entidades en bases de datos y directorios profesionales en linea.
US8572221B2 (en) 2004-05-26 2013-10-29 Facebook, Inc. System and method for managing an online social network
US8010458B2 (en) * 2004-05-26 2011-08-30 Facebook, Inc. System and method for managing information flow between members of an online social network
US7788260B2 (en) * 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
US7478078B2 (en) * 2004-06-14 2009-01-13 Friendster, Inc. Method for sharing relationship information stored in a social network database with third party databases
US10373173B2 (en) * 2004-06-14 2019-08-06 Facebook, Inc. Online content delivery based on information from social networks
US8161184B2 (en) * 2004-06-25 2012-04-17 Apple Inc. Method and apparatus for facilitating long-lived DNS queries
US8302164B2 (en) 2004-07-22 2012-10-30 Facebook, Inc. Authorization and authentication based on an individual's social network
US7606687B2 (en) 2004-09-14 2009-10-20 Friendster, Inc. Proximity search methods using tiles to represent geographical zones
US20060085373A1 (en) * 2004-09-30 2006-04-20 Dhillion Jasjit S Method and apparatus for creating relationships over a network
US7451161B2 (en) 2005-04-28 2008-11-11 Friendster, Inc. Compatibility scoring of users in a social network
US9792351B2 (en) * 2005-06-10 2017-10-17 International Business Machines Corporation Tolerant and extensible discovery of relationships in data using structural information and data analysis
WO2007030685A2 (en) * 2005-09-09 2007-03-15 Robert Howe Pinckney Method and system for message storage and retrieval
CN100396002C (zh) * 2005-11-23 2008-06-18 华为技术有限公司 一种利用关联查询进行鉴权的系统及其方法
US8204831B2 (en) 2006-11-13 2012-06-19 International Business Machines Corporation Post-anonymous fuzzy comparisons without the use of pre-anonymization variants
US10452763B2 (en) * 2007-03-08 2019-10-22 Oath Inc. Autocomplete for integrating diverse methods of electronic communication
US9372909B2 (en) 2007-05-15 2016-06-21 Paypal, Inc. Defining a set of data across mutiple databases using variables and functions
US8156158B2 (en) * 2007-07-18 2012-04-10 Famillion Ltd. Method and system for use of a database of personal data records
DE102007057248A1 (de) * 2007-11-16 2009-05-20 T-Mobile International Ag Verbindungsschicht für Datenbanken
US10733223B2 (en) * 2008-01-08 2020-08-04 International Business Machines Corporation Term-driven records file plan and thesaurus design
CN101277272B (zh) * 2008-05-16 2010-12-15 北京航空航天大学 一种海量广播数据入库的实现方法
WO2010063311A1 (en) * 2008-12-02 2010-06-10 Telefonaktiebolaget L M Ericsson (Publ) System and method for matching entities
US8359337B2 (en) * 2008-12-09 2013-01-22 Ingenix, Inc. Apparatus, system and method for member matching
US9910875B2 (en) * 2008-12-22 2018-03-06 International Business Machines Corporation Best-value determination rules for an entity resolution system
US8732176B2 (en) * 2009-04-28 2014-05-20 Palo Alto Research Center Incorporated Web-based tool for detecting bias in reviews
US9727842B2 (en) 2009-08-21 2017-08-08 International Business Machines Corporation Determining entity relevance by relationships to other relevant entities
US8423525B2 (en) 2010-03-30 2013-04-16 International Business Machines Corporation Life arcs as an entity resolution feature
US9110968B2 (en) 2010-04-14 2015-08-18 At&T Intellectual Property I, L.P. Removal of invisible data packages in data warehouses
US8572129B1 (en) 2010-04-19 2013-10-29 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US9262482B2 (en) 2010-04-19 2016-02-16 Facebook, Inc. Generating default search queries on online social networks
US9092485B2 (en) 2010-04-19 2015-07-28 Facebook, Inc. Dynamic suggested search queries on online social networks
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US9223838B2 (en) 2010-04-19 2015-12-29 Facebook, Inc. Sponsored search queries on online social networks
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US9275119B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Sharing search queries on online social network
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US10402419B1 (en) 2010-04-19 2019-09-03 Facebook, Inc. Search queries with previews of search results on online social networks
US9633121B2 (en) 2010-04-19 2017-04-25 Facebook, Inc. Personalizing default search queries on online social networks
US9275101B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Search queries with previews of search results on online social networks
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
CN102314460B (zh) * 2010-07-07 2014-05-14 阿里巴巴集团控股有限公司 数据分析方法、系统及服务器
US8468119B2 (en) * 2010-07-14 2013-06-18 Business Objects Software Ltd. Matching data from disparate sources
CN102214228B (zh) * 2011-06-24 2013-03-13 国电南瑞科技股份有限公司 大电网分布式实时数据库系统的数据管理方法
US8965848B2 (en) * 2011-08-24 2015-02-24 International Business Machines Corporation Entity resolution based on relationships to a common entity
US8943059B2 (en) * 2011-12-21 2015-01-27 Sap Se Systems and methods for merging source records in accordance with survivorship rules
US8812542B1 (en) * 2012-03-30 2014-08-19 Emc Corporation On-the-fly determining of alert relationships in a distributed system
US20130339186A1 (en) * 2012-06-15 2013-12-19 Eventbrite, Inc. Identifying Fraudulent Users Based on Relational Information
US8935255B2 (en) 2012-07-27 2015-01-13 Facebook, Inc. Social static ranking for search
US9398104B2 (en) 2012-12-20 2016-07-19 Facebook, Inc. Ranking test framework for search results on an online social network
US9223826B2 (en) 2013-02-25 2015-12-29 Facebook, Inc. Pushing suggested search queries to mobile devices
US9910887B2 (en) 2013-04-25 2018-03-06 Facebook, Inc. Variable search query vertical access
US9330183B2 (en) 2013-05-08 2016-05-03 Facebook, Inc. Approximate privacy indexing for search queries on online social networks
US9223898B2 (en) 2013-05-08 2015-12-29 Facebook, Inc. Filtering suggested structured queries on online social networks
US9305322B2 (en) 2013-07-23 2016-04-05 Facebook, Inc. Native application testing
US9317614B2 (en) 2013-07-30 2016-04-19 Facebook, Inc. Static rankings for search queries on online social networks
US9514230B2 (en) 2013-07-30 2016-12-06 Facebook, Inc. Rewriting search queries on online social networks
US9460215B2 (en) 2013-12-19 2016-10-04 Facebook, Inc. Ranking recommended search queries on online social networks
US9336300B2 (en) 2014-01-17 2016-05-10 Facebook, Inc. Client-side search templates for online social networks
US9477760B2 (en) 2014-02-12 2016-10-25 Facebook, Inc. Query construction on online social networks
US9798832B1 (en) 2014-03-31 2017-10-24 Facebook, Inc. Dynamic ranking of user cards
US9794359B1 (en) 2014-03-31 2017-10-17 Facebook, Inc. Implicit contacts in an online social network
US20150278838A1 (en) * 2014-04-01 2015-10-01 TekWear, LLC Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device
US11169773B2 (en) 2014-04-01 2021-11-09 TekWear, LLC Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device
US9646055B2 (en) 2014-04-03 2017-05-09 Facebook, Inc. Blending search results on online social networks
US9679078B2 (en) 2014-05-21 2017-06-13 Facebook, Inc. Search client context on online social networks
US10268763B2 (en) 2014-07-25 2019-04-23 Facebook, Inc. Ranking external content on online social networks
US9871714B2 (en) 2014-08-01 2018-01-16 Facebook, Inc. Identifying user biases for search results on online social networks
US10255244B2 (en) 2014-08-01 2019-04-09 Facebook, Inc. Search results based on user biases on online social networks
US9792364B2 (en) 2014-08-08 2017-10-17 Facebook, Inc. Blending search results on online social networks
US10120909B2 (en) 2014-08-22 2018-11-06 Facebook, Inc. Generating cards in response to user actions on online social networks
US9703859B2 (en) 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US10255365B2 (en) 2014-08-29 2019-04-09 Facebook, Inc. Priming search results on online social networks
US10740412B2 (en) 2014-09-05 2020-08-11 Facebook, Inc. Pivoting search results on online social networks
US9507876B2 (en) 2014-10-06 2016-11-29 Facebook, Inc. Constructing queries using query filters on online social networks
US9703870B2 (en) 2014-11-05 2017-07-11 Facebook, Inc. Social-based optimization of web crawling for online social networks
US10409873B2 (en) 2014-11-26 2019-09-10 Facebook, Inc. Searching for content by key-authors on online social networks
US10552759B2 (en) 2014-12-01 2020-02-04 Facebook, Inc. Iterative classifier training on online social networks
US9679024B2 (en) 2014-12-01 2017-06-13 Facebook, Inc. Social-based spelling correction for online social networks
US9990441B2 (en) 2014-12-05 2018-06-05 Facebook, Inc. Suggested keywords for searching content on online social networks
US10102273B2 (en) 2014-12-30 2018-10-16 Facebook, Inc. Suggested queries for locating posts on online social networks
US10061856B2 (en) * 2015-01-29 2018-08-28 Facebook, Inc. Multimedia search using reshare text on online social networks
US20160224993A1 (en) * 2015-02-03 2016-08-04 Bank Of America Corporation System for determining relationships between entities
US10997257B2 (en) 2015-02-06 2021-05-04 Facebook, Inc. Aggregating news events on online social networks
US10049099B2 (en) 2015-04-10 2018-08-14 Facebook, Inc. Spell correction with hidden markov models on online social networks
US10095683B2 (en) 2015-04-10 2018-10-09 Facebook, Inc. Contextual speller models on online social networks
US10628636B2 (en) 2015-04-24 2020-04-21 Facebook, Inc. Live-conversation modules on online social networks
US10298535B2 (en) 2015-05-19 2019-05-21 Facebook, Inc. Civic issues platforms on online social networks
US10397167B2 (en) 2015-06-19 2019-08-27 Facebook, Inc. Live social modules on online social networks
US10509832B2 (en) 2015-07-13 2019-12-17 Facebook, Inc. Generating snippet modules on online social networks
US10268664B2 (en) 2015-08-25 2019-04-23 Facebook, Inc. Embedding links in user-created content on online social networks
US10810217B2 (en) 2015-10-07 2020-10-20 Facebook, Inc. Optionalization and fuzzy search on online social networks
US10795936B2 (en) 2015-11-06 2020-10-06 Facebook, Inc. Suppressing entity suggestions on online social networks
US10270868B2 (en) 2015-11-06 2019-04-23 Facebook, Inc. Ranking of place-entities on online social networks
US9602965B1 (en) 2015-11-06 2017-03-21 Facebook, Inc. Location-based place determination using online social networks
US10534814B2 (en) 2015-11-11 2020-01-14 Facebook, Inc. Generating snippets on online social networks
US10387511B2 (en) 2015-11-25 2019-08-20 Facebook, Inc. Text-to-media indexes on online social networks
CN106817390B (zh) 2015-12-01 2020-04-24 阿里巴巴集团控股有限公司 一种用户数据共享的方法和设备
US10740368B2 (en) 2015-12-29 2020-08-11 Facebook, Inc. Query-composition platforms on online social networks
US10019466B2 (en) 2016-01-11 2018-07-10 Facebook, Inc. Identification of low-quality place-entities on online social networks
US10162899B2 (en) 2016-01-15 2018-12-25 Facebook, Inc. Typeahead intent icons and snippets on online social networks
US10262039B1 (en) 2016-01-15 2019-04-16 Facebook, Inc. Proximity-based searching on online social networks
US10740375B2 (en) 2016-01-20 2020-08-11 Facebook, Inc. Generating answers to questions using information posted by users on online social networks
US10157224B2 (en) 2016-02-03 2018-12-18 Facebook, Inc. Quotations-modules on online social networks
US10242074B2 (en) 2016-02-03 2019-03-26 Facebook, Inc. Search-results interfaces for content-item-specific modules on online social networks
US10216850B2 (en) 2016-02-03 2019-02-26 Facebook, Inc. Sentiment-modules on online social networks
US10270882B2 (en) 2016-02-03 2019-04-23 Facebook, Inc. Mentions-modules on online social networks
US10452671B2 (en) 2016-04-26 2019-10-22 Facebook, Inc. Recommendations from comments on online social networks
US10659299B1 (en) 2016-06-30 2020-05-19 Facebook, Inc. Managing privacy settings for content on online social networks
US10635661B2 (en) 2016-07-11 2020-04-28 Facebook, Inc. Keyboard-based corrections for search queries on online social networks
US10282483B2 (en) 2016-08-04 2019-05-07 Facebook, Inc. Client-side caching of search keywords for online social networks
US10223464B2 (en) 2016-08-04 2019-03-05 Facebook, Inc. Suggesting filters for search on online social networks
US10726022B2 (en) 2016-08-26 2020-07-28 Facebook, Inc. Classifying search queries on online social networks
US10534815B2 (en) 2016-08-30 2020-01-14 Facebook, Inc. Customized keyword query suggestions on online social networks
US10102255B2 (en) 2016-09-08 2018-10-16 Facebook, Inc. Categorizing objects for queries on online social networks
US10645142B2 (en) 2016-09-20 2020-05-05 Facebook, Inc. Video keyframes display on online social networks
US10026021B2 (en) 2016-09-27 2018-07-17 Facebook, Inc. Training image-recognition systems using a joint embedding model on online social networks
US10083379B2 (en) 2016-09-27 2018-09-25 Facebook, Inc. Training image-recognition systems based on search queries on online social networks
US10579688B2 (en) 2016-10-05 2020-03-03 Facebook, Inc. Search ranking and recommendations for online social networks based on reconstructed embeddings
US10311117B2 (en) 2016-11-18 2019-06-04 Facebook, Inc. Entity linking to query terms on online social networks
US10650009B2 (en) 2016-11-22 2020-05-12 Facebook, Inc. Generating news headlines on online social networks
US10235469B2 (en) 2016-11-30 2019-03-19 Facebook, Inc. Searching for posts by related entities on online social networks
US10185763B2 (en) 2016-11-30 2019-01-22 Facebook, Inc. Syntactic models for parsing search queries on online social networks
US10313456B2 (en) 2016-11-30 2019-06-04 Facebook, Inc. Multi-stage filtering for recommended user connections on online social networks
US10162886B2 (en) 2016-11-30 2018-12-25 Facebook, Inc. Embedding-based parsing of search queries on online social networks
US11223699B1 (en) 2016-12-21 2022-01-11 Facebook, Inc. Multiple user recognition with voiceprints on online social networks
US10607148B1 (en) 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
US10535106B2 (en) 2016-12-28 2020-01-14 Facebook, Inc. Selecting user posts related to trending topics on online social networks
US10489472B2 (en) 2017-02-13 2019-11-26 Facebook, Inc. Context-based search suggestions on online social networks
US10614141B2 (en) 2017-03-15 2020-04-07 Facebook, Inc. Vital author snippets on online social networks
US10769222B2 (en) 2017-03-20 2020-09-08 Facebook, Inc. Search result ranking based on post classifiers on online social networks
US11379861B2 (en) 2017-05-16 2022-07-05 Meta Platforms, Inc. Classifying post types on online social networks
US10248645B2 (en) 2017-05-30 2019-04-02 Facebook, Inc. Measuring phrase association on online social networks
US10268646B2 (en) 2017-06-06 2019-04-23 Facebook, Inc. Tensor-based deep relevance model for search on online social networks
US10489468B2 (en) 2017-08-22 2019-11-26 Facebook, Inc. Similarity search using progressive inner products and bounds
US10776437B2 (en) 2017-09-12 2020-09-15 Facebook, Inc. Time-window counters for search results on online social networks
US10678786B2 (en) 2017-10-09 2020-06-09 Facebook, Inc. Translating search queries on online social networks
US10810214B2 (en) 2017-11-22 2020-10-20 Facebook, Inc. Determining related query terms through query-post associations on online social networks
US10963514B2 (en) 2017-11-30 2021-03-30 Facebook, Inc. Using related mentions to enhance link probability on online social networks
US10129705B1 (en) 2017-12-11 2018-11-13 Facebook, Inc. Location prediction using wireless signals on online social networks
US11604968B2 (en) 2017-12-11 2023-03-14 Meta Platforms, Inc. Prediction of next place visits on online social networks
CN110019274B (zh) 2017-12-29 2023-09-26 阿里巴巴集团控股有限公司 一种数据库系统以及查询数据库的方法和装置
CN108509182A (zh) * 2018-02-27 2018-09-07 北京航空航天大学 将非结构化大数据进行结构化处理并融合的软件技术
CN109086574B (zh) * 2018-08-16 2022-01-07 国家卫生健康委科学技术研究所 疾病相关蛋白数据库
CN111406252B (zh) * 2019-11-06 2022-04-15 支付宝(杭州)信息技术有限公司 基于纠错码的共享区块链数据存储的共识
CN114969041B (zh) * 2022-05-27 2023-06-30 河北省科学技术情报研究院(河北省科技创新战略研究院) 一种多源主附实体同一性甄别及数据自补的处理方法

Family Cites Families (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US599175A (en) * 1898-02-15 Washing-machine
US579424A (en) * 1897-03-23 Edwakd c
US1261167A (en) * 1917-10-25 1918-04-02 Robert C Russell Index.
US3659085A (en) * 1970-04-30 1972-04-25 Sierra Research Corp Computer determining the location of objects in a coordinate system
US4232313A (en) * 1972-09-22 1980-11-04 The United States Of America As Represented By The Secretary Of The Navy Tactical nagivation and communication system
US5010478A (en) * 1986-04-11 1991-04-23 Deran Roger L Entity-attribute value database system with inverse attribute for selectively relating two different entities
JPS63282838A (ja) 1987-05-14 1988-11-18 Fujitsu Ltd 名寄せ処理方式
JPH0212563A (ja) 1988-06-30 1990-01-17 Nec Corp 情報管理方式
US5345587A (en) * 1988-09-14 1994-09-06 Digital Equipment Corporation Extensible entity management system including a dispatching kernel and modules which independently interpret and execute commands
JPH0317792A (ja) 1989-06-14 1991-01-25 Mitsubishi Plastics Ind Ltd カードの記録方法
JPH03177972A (ja) * 1989-12-07 1991-08-01 Nec Corp データベースシステム
US4981370A (en) * 1990-01-29 1991-01-01 Dziewit Halina S Document authentication apparatus
US5555409A (en) * 1990-12-04 1996-09-10 Applied Technical Sysytem, Inc. Data management systems and methods including creation of composite views of data
JPH04237373A (ja) * 1991-01-22 1992-08-25 Toshiba Corp キーワード入力方式
US5560006A (en) * 1991-05-15 1996-09-24 Automated Technology Associates, Inc. Entity-relation database
US5229764A (en) * 1991-06-20 1993-07-20 Matchett Noel D Continuous biometric authentication matrix
JP2922347B2 (ja) * 1991-11-07 1999-07-19 富士通株式会社 異種データベース間のデータ結合装置及びデータ結合方法
JPH05250416A (ja) * 1992-03-06 1993-09-28 Toshiba Eng Co Ltd データベースの登録・検索装置
EP0581421B1 (en) * 1992-07-20 2003-01-15 Compaq Computer Corporation Method and system for certificate based alias detection
US5403639A (en) * 1992-09-02 1995-04-04 Storage Technology Corporation File server having snapshot application data groups
US5454101A (en) * 1992-09-15 1995-09-26 Universal Firmware Industries, Ltd. Data storage system with set lists which contain elements associated with parents for defining a logical hierarchy and general record pointers identifying specific data sets
US5742806A (en) * 1994-01-31 1998-04-21 Sun Microsystems, Inc. Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system
US5764977A (en) * 1994-03-30 1998-06-09 Siemens Stromberg-Carlson Distributed database architecture and distributed database management system for open network evolution
US5848373A (en) * 1994-06-24 1998-12-08 Delorme Publishing Company Computer aided map location system
JPH0863382A (ja) * 1994-08-19 1996-03-08 Fujitsu Ltd 分散システムにおけるデータ整合性確認方法及びデータ整合性確認装置
US5675785A (en) * 1994-10-04 1997-10-07 Hewlett-Packard Company Data warehouse which is accessed by a user using a schema of virtual tables
US5873093A (en) * 1994-12-07 1999-02-16 Next Software, Inc. Method and apparatus for mapping objects to a data source
US5799309A (en) * 1994-12-29 1998-08-25 International Business Machines Corporation Generating an optimized set of relational queries fetching data in an object-relational database
JPH08305662A (ja) * 1995-05-02 1996-11-22 Fujitsu Ltd クライアント認証システムおよび方法
US5659731A (en) * 1995-06-19 1997-08-19 Dun & Bradstreet, Inc. Method for rating a match for a given entity found in a list of entities
US5758343A (en) * 1995-12-08 1998-05-26 Ncr Corporation Apparatus and method for integrating multiple delegate directory service agents
US6035300A (en) * 1995-12-15 2000-03-07 International Business Machines Corporation Method and apparatus for generating a user interface from the entity/attribute/relationship model of a database
US5991733A (en) * 1996-03-22 1999-11-23 Hartford Fire Insurance Company Method and computerized system for managing insurance receivable accounts
US5878416A (en) * 1996-06-14 1999-03-02 Electronic Data Systems Corporation Automated system and method for matching an item of business property to a recipient
US5778375A (en) * 1996-06-27 1998-07-07 Microsoft Corporation Database normalizing system
US6052693A (en) * 1996-07-02 2000-04-18 Harlequin Group Plc System for assembling large databases through information extracted from text sources
US5819263A (en) * 1996-07-19 1998-10-06 American Express Financial Corporation Financial planning system incorporating relationship and group management
US5781911A (en) * 1996-09-10 1998-07-14 D2K, Incorporated Integrated system and method of data warehousing and delivery
US5892828A (en) * 1996-10-23 1999-04-06 Novell, Inc. User presence verification with single password across applications
US6076167A (en) * 1996-12-04 2000-06-13 Dew Engineering And Development Limited Method and system for improving security in network applications
US5845285A (en) * 1997-01-07 1998-12-01 Klein; Laurence C. Computer system and method of data analysis
JP4268690B2 (ja) * 1997-03-26 2009-05-27 ソニー株式会社 認証システムおよび方法、並びに認証方法
JP4027455B2 (ja) * 1997-03-31 2007-12-26 富士通株式会社 データベース管理システム
ES2192323T3 (es) * 1997-04-16 2003-10-01 British Telecomm Generador de sumarios de datos.
CA2329345A1 (en) * 1997-04-22 1998-10-29 Greg Hetherington Method and apparatus for processing free-format data
US5794246A (en) * 1997-04-30 1998-08-11 Informatica Corporation Method for incremental aggregation of dynamically increasing database data sets
US6032158A (en) * 1997-05-02 2000-02-29 Informatica Corporation Apparatus and method for capturing and propagating changes from an operational database to data marts
US5991765A (en) * 1997-05-06 1999-11-23 Birdstep Technology As System and method for storing and manipulating data in an information handling system
US6202151B1 (en) * 1997-05-09 2001-03-13 Gte Service Corporation System and method for authenticating electronic transactions using biometric certificates
US5991408A (en) * 1997-05-16 1999-11-23 Veridicom, Inc. Identification and security using biometric measurements
JP3547069B2 (ja) * 1997-05-22 2004-07-28 日本電信電話株式会社 情報関連づけ装置およびその方法
US5991758A (en) * 1997-06-06 1999-11-23 Madison Information Technologies, Inc. System and method for indexing information about entities from different information sources
US6122757A (en) * 1997-06-27 2000-09-19 Agilent Technologies, Inc Code generating system for improved pattern matching in a protocol analyzer
US6092199A (en) * 1997-07-07 2000-07-18 International Business Machines Corporation Dynamic creation of a user account in a client following authentication from a non-native server domain
US6523041B1 (en) * 1997-07-29 2003-02-18 Acxiom Corporation Data linking system and method using tokens
US6073140A (en) * 1997-07-29 2000-06-06 Acxiom Corporation Method and system for the creation, enhancement and update of remote data using persistent keys
US5995973A (en) * 1997-08-29 1999-11-30 International Business Machines Corporation Storing relationship tables identifying object relationships
US6044378A (en) * 1997-09-29 2000-03-28 International Business Machines Corporation Method and system for a federated digital library by managing links
US6357004B1 (en) * 1997-09-30 2002-03-12 Intel Corporation System and method for ensuring integrity throughout post-processing
US6014670A (en) * 1997-11-07 2000-01-11 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6339775B1 (en) * 1997-11-07 2002-01-15 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6035306A (en) * 1997-11-24 2000-03-07 Terascape Software Inc. Method for improving performance of large databases
US6041410A (en) * 1997-12-22 2000-03-21 Trw Inc. Personal identification fob
US6263446B1 (en) * 1997-12-23 2001-07-17 Arcot Systems, Inc. Method and apparatus for secure distribution of authentication credentials to roaming users
JPH11184884A (ja) 1997-12-24 1999-07-09 Ntt Data Corp 同一人判定システムおよび方法
US5933831A (en) * 1998-01-09 1999-08-03 Lsi Logic Corporation Viewing entity relationship diagrams using hyperlinks
US6418450B2 (en) * 1998-01-26 2002-07-09 International Business Machines Corporation Data warehouse programs architecture
US6845453B2 (en) * 1998-02-13 2005-01-18 Tecsec, Inc. Multiple factor-based user identification and authentication
US6049805A (en) * 1998-02-24 2000-04-11 Microsoft Corporation Dynamic event mechanism for objects with associational relationships
GB2336007B (en) * 1998-04-01 2003-01-29 Mitel Corp Agent-based data mining and warehousing
JP3437441B2 (ja) * 1998-04-08 2003-08-18 日本電信電話株式会社 検索方法、検索装置、および検索プログラムを記録した記録媒体
US6167517A (en) * 1998-04-09 2000-12-26 Oracle Corporation Trusted biometric client authentication
US6160903A (en) * 1998-04-24 2000-12-12 Dew Engineering And Development Limited Method of providing secure user access
US6684334B1 (en) * 1998-05-27 2004-01-27 Trusted Security Solutions, Inc. Secure establishment of cryptographic keys using persistent key component
US6208990B1 (en) * 1998-07-15 2001-03-27 Informatica Corporation Method and architecture for automated optimization of ETL throughput in data warehousing applications
US6185557B1 (en) * 1998-07-31 2001-02-06 Unisys Corporation Merge join process
US6743022B1 (en) * 1998-12-03 2004-06-01 Oded Sarel System and method for automated self measurement of alertness equilibrium and coordination and for ventification of the identify of the person performing tasks
US6931392B1 (en) * 1998-12-07 2005-08-16 Vitria Technology, Inc. Real-time decision support system
US6317834B1 (en) * 1999-01-29 2001-11-13 International Business Machines Corporation Biometric authentication system with encrypted models
US6819797B1 (en) * 1999-01-29 2004-11-16 International Business Machines Corporation Method and apparatus for classifying and querying temporal and spatial information in video
AU2523300A (en) 1999-04-07 2000-10-12 Reclaim Technologies And Sservices, Ltd. A system for identification of selectively related database records
US20020038308A1 (en) * 1999-05-27 2002-03-28 Michael Cappi System and method for creating a virtual data warehouse
US6697947B1 (en) * 1999-06-17 2004-02-24 International Business Machines Corporation Biometric based multi-party authentication
US6385604B1 (en) * 1999-08-04 2002-05-07 Hyperroll, Israel Limited Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements
JP2001118103A (ja) * 1999-10-15 2001-04-27 Oki Electric Ind Co Ltd ゲート管理装置
ATE410754T1 (de) * 1999-10-19 2008-10-15 Stamps Com System und verfahren zum adressvergleich
JP2001117940A (ja) 1999-10-20 2001-04-27 Just Syst Corp 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7003560B1 (en) * 1999-11-03 2006-02-21 Accenture Llp Data warehouse computing system
NZ543166A (en) * 2000-04-07 2006-12-22 Procter & Gamble Monitoring the effective velocity of items through a store or warehouse for predicting stock levels
JP2001325425A (ja) 2000-05-15 2001-11-22 Fujitsu Ltd 名寄せ処理システム
GB2366160B (en) * 2000-08-09 2004-03-17 Michaelhouse Man Ltd Information routing
US7302582B2 (en) * 2000-08-21 2007-11-27 United States Postal Service Delivery point validation system
US6675476B2 (en) * 2000-12-05 2004-01-13 Hewlett-Packard Development Company, L.P. Slotted substrates and techniques for forming same
US6954757B2 (en) * 2001-02-02 2005-10-11 Hewlett-Packard Development Company, L.P. Framework, architecture, method and system for reducing latency of business operations of an enterprise
US6886747B2 (en) * 2001-03-22 2005-05-03 United States Postal Service System and method for standardizing a mailing address
US7856420B2 (en) * 2001-04-19 2010-12-21 Hewlett-Packard Development Company, L.P. Zero latency enterprise enriched publish/subscribe
US7092951B1 (en) * 2001-07-06 2006-08-15 Ncr Corporation Auxiliary relation for materialized view
US20030030733A1 (en) * 2001-08-08 2003-02-13 Seaman Mark D. System and method for synchronization of media data
US6912549B2 (en) * 2001-09-05 2005-06-28 Siemens Medical Solutions Health Services Corporation System for processing and consolidating records
US7370044B2 (en) * 2001-11-19 2008-05-06 Equifax, Inc. System and method for managing and updating information relating to economic entities
KR100850255B1 (ko) * 2001-12-28 2008-08-19 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징
US7590544B2 (en) * 2002-03-06 2009-09-15 United States Postal Service Method for correcting a mailing address
AU2003213722A1 (en) * 2002-03-21 2003-10-08 David J. Payne Method and system for storing and retrieving data using hash-accessed multiple data stores
US7096213B2 (en) * 2002-04-08 2006-08-22 Oracle International Corporation Persistent key-value repository with a pluggable architecture to abstract physical storage
US6968338B1 (en) 2002-08-29 2005-11-22 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Extensible database framework for management of unstructured and semi-structured documents
US7159119B2 (en) * 2002-09-06 2007-01-02 United States Postal Service Method and system for efficiently retrieving secured data by securely pre-processing provided access information
US7900052B2 (en) * 2002-11-06 2011-03-01 International Business Machines Corporation Confidential data sharing and anonymous entity resolution
US20040099313A1 (en) * 2002-11-26 2004-05-27 Gotthelf Jeffrey Bryan Fluid flow pressure regulator
WO2004061668A1 (en) * 2002-12-31 2004-07-22 International Business Machines Corporation Authorized anonymous authentication
US7200602B2 (en) * 2003-02-07 2007-04-03 International Business Machines Corporation Data set comparison and net change processing
WO2004097596A2 (en) 2003-03-24 2004-11-11 Systems Research & Development Secure coordinate identification method, system and program

Also Published As

Publication number Publication date
AU2002367376A1 (en) 2003-07-24
US8452787B2 (en) 2013-05-28
KR20070112423A (ko) 2007-11-23
KR20070112422A (ko) 2007-11-23
JP4456646B2 (ja) 2010-04-28
EA200400873A1 (ru) 2005-12-29
KR100856771B1 (ko) 2008-09-05
KR100850255B1 (ko) 2008-08-19
PL374305A1 (en) 2005-10-03
EP1470475A4 (en) 2009-04-22
IL162746A0 (en) 2005-11-20
JP2009059372A (ja) 2009-03-19
BR0215411A (pt) 2005-09-06
CA2471940C (en) 2019-03-05
CN1656442A (zh) 2005-08-17
KR100877461B1 (ko) 2009-01-07
CN101324902A (zh) 2008-12-17
EP1470475A1 (en) 2004-10-27
US8615521B2 (en) 2013-12-24
US20060010119A1 (en) 2006-01-12
JP2006501529A (ja) 2006-01-12
WO2003058427A8 (en) 2005-06-02
JP4366433B2 (ja) 2009-11-18
WO2003058427A1 (en) 2003-07-17
CN100483333C (zh) 2009-04-29
JP2009059371A (ja) 2009-03-19
KR20040088036A (ko) 2004-10-15
CA2471940A1 (en) 2003-07-17
ZA200405141B (en) 2005-11-21
US20030154194A1 (en) 2003-08-14

Similar Documents

Publication Publication Date Title
MXPA04006390A (es) Creacion de depositos de datos en tiempo real.
US8620937B2 (en) Real time data warehousing
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
Gu et al. Record linkage: Current practice and future directions
US8768914B2 (en) System and method for searching and matching databases
AU2008339587B2 (en) Data normalisation for investigative data mining
JP5193061B2 (ja) 顧客駆動型クエリからの照合を強化するための方法およびシステム
CN114090076A (zh) 应用程序的合规性判别方法和装置
CN110781213B (zh) 一种以人员为中心的多源海量数据关联搜索方法和系统
JPH06274550A (ja) 名刺管理システム
CN113204644B (zh) 一种基于知识图谱的政务百科构建方法