MXPA04006390A

MXPA04006390A - Creacion de depositos de datos en tiempo real.

Info

Publication number: MXPA04006390A
Application number: MXPA04006390A
Authority: MX
Inventors: James Jonas Jeffrey
Original assignee: James Jonas Jeffrey
Priority date: 2001-12-28
Filing date: 2002-12-27
Publication date: 2005-06-08
Also published as: AU2002367376A1; US8452787B2; KR20070112423A; KR20070112422A; JP4456646B2; EA200400873A1; KR100856771B1; KR100850255B1; PL374305A1; EP1470475A4; IL162746A0; JP2009059372A; BR0215411A; CA2471940C; CN1656442A; KR100877461B1; CN101324902A; EP1470475A1; US8615521B2; US20060010119A1

Abstract

Se describen un metodo y sistema para procesar datos a y en una base de datos (16) y para recuperar los datos procesados. Los datos comprenden identificadores de una pluralidad de entidades (18). El metodo y sistema comprenden: a) procesar datos a y en una base de datos (16), (b) mejorar los datos recibidos (20) antes de almacenarse en una base de datos (16), (c) determinar y comparar registros basandose en relaciones entre los registros en los datos recibidos (20) produciendo datos sin perdida de datos, (d) habilitar alertas basandose en reglas y relaciones de alerta definidas por el usuario. (e) detener automaticamente comparaciones adicionales y separar las previamente comparadas cuando los identificadores usados para comparar registros son posteriormente determinados como comunes a traves de entidades y no generalmente caracteristico de una entidad, (f) recibir consultas de datos (48) para recuperar los datos procesados almacenados en la base de datos (16), (g) utilizar el mismo algoritmo para procesar las consultas (46), y (h) transferir los datos procesados a otra base de datos que utilice el mismo algoritmo.

Description

CREACION DE DEPOSITOS DE DATOS EN TIEMPO REAL REFERENCIA CRUZADA A LAS SOLICITUDES RELACIONADAS La presente solicitud reclama el beneficio de la solicitud provisional No. 60/344,067, presentada en la oficina de patentes de Estados Unidos el 28 de Diciembre del 2001.

FEDERALMENTE AUSPICIADA O EN DESARROLLO No Aplicable.

CAMPO TECNICO Esta invención se refiere a un método, programa y sistema para procesar y recuperar datos en una creación de depósitos de datos y, más particularmente, a un método, programa y sistema para el procesamiento de datos a y en una creación de depósitos de datos, a la consulta de datos en una creación de depósitos de datos, y al análisis de los datos en una creación de depósitos de datos.

ANTECEDENTES DE LA INVENCION Las creaciones de depósitos de datos son bases de datos a base de computadora diseñadas para almacenar registros y responder a consultas o preguntas generalmente de múltiples fuentes. Los recursos corresponden con entidades, tales como individuos, organizaciones y propiedades. Cada registro contiene identificadores de la entidad, tal como, por ejemplo, nombre, dirección o información de cuenta para un individuo. Desafortunadamente, la efectividad de los sistemas de creación de depósitos de datos actuales se está disminuyendo debido a ciertas limitaciones que crean, perpetúan y/o incrementan cjerta calidad de datos, integridad y emisiones de funcionamiento. Dichas limitación también incrementan el riesgo, costo y tiempo requeridos para implementar, corregir y mantener tales sistemas. Las emisiones y limitaciones incluyen, sin limitación, las siguiente: (a) retos asociados con formatos de diferencia o de conflicto que emanan de las varias fuentes de datos, (b) datos incompletos a base de información faltante en cuanto se reciben, (c) múltiples registros introducidos que reflejan la misma entidad basándose en (por lo regular menos) discrepancias o mala ortografía, (d) capacidad insuficiente para identificar si múltiples registros están reflejando la misma entidad y/o si existe alguna relación entre los múltiples registros, (e) datos perdidos cuando dos registros determinados reflejan la misma entidad y emergen o un registro se desecha, (f) insuficiente capacidad para separar posteriormente registros cuando los registros que surgen son determinados posteriormente para reflejar dos entidades separadas, (g) capacidad insuficiente para emitir alertas basándose en reglas de alerta definidas por el usuario en tiempo real, (h) resultados inadecuados de consultas o preguntas que utilizan diferentes algoritmos o procedimientos de conversión que los algoritmos o procedimientos de conversión utilizados para procesar datos recibidos, y (i) incapacidad para mantener una consulta persistente de acuerdo con un criterio predeterminado, tal como durante cierto periodo de tiempo. Por ejemplo, cuando los identificadores de un individuo son recibidos y almacenados en una base de datos: (a) los registros de una fuente pueden hacerse disponibles en un formato delimitado con una coma, mientras que los registros de otra fuente pueden ser recibidos en otro formato de datos; (b) los datos de varios registros pueden estar faltantes, tales como un número telefónico, dirección, o alguna otra información de identificación; o (c) dos registros que reflejan al mismo individuo pueden ser recibidos en forma desconocida ya que un registro corresponde a un nombre real y otro registro corresponde a un nombre de soltero. En la última situación, el sistema puede determinar que los dos registros tienen que ser unidos o que un registro (tal vez que emana de una fuente menos confiable) sea desechado. Sin embargo, en el procedimiento de unión, los sistemas actuales típicamente abandonan datos, lo cual niega la habilidad para separar posteriormente los dos registros si se determina que los registros reflejan dos entidades separadas. Además, cuando los identificadores son recibidos y almacenados en la base de datos, la computadora puede realizar procedimientos de transformación y de mejora antes de cargar los datos a la base de datos. Sin embargo, las herramientas de consulta de sistemas actuales utilizan pocos, si hay alguno, de los procedimientos de transformación de y de mejora usados para recibir y procesar los datos recibidos, haciendo que cualesquiera resultados de tales consultas sean inconsistentes, y por lo tanto, inadecuados, insuficientes y potencialmente falsos. Similarmente, los sistemas de creación de depósitos de datos actuales no tienen las herramientas necesarias para identificar totalmente la relación entre entidades, o determinar si dichas entidades reflejan o no la misma entidad en tiempo real. Por ejemplo, un individuo puede tener la misma dirección de un segundo individuo y el segundo individuo puede tener el mismo número telefónico de un tercer individuo. En tales circunstancias, podría ser benéfico determinar la probabilidad de que el primer individuo tuviera cierta relación con el tercer individuo, especialmente en tiempo real. Además, los sistemas de creación de depósitos de datos actuales tienen la habilidad limitada para identificar relaciones inapropiadas o de conflicto entre entidades y proporcionan alertas en reglas de alerta definidas por el usuario basándose en tiempo real. Dicha habilidad limitada se basa en varios factores, incluyendo, sin limitación, la incapacidad de identificar eficiente relaciones como se indicó antes. Además, los sistemas de creación de depósitos de datos actuales primero no pueden transformar y mejorar un registro y después mantener una consulta persistente durante un periodo predeterminado. Una consulta persistente podría ser benéfica en varias circunstancias, incluyendo, sin limitación, en casos en donde el nombre de una persona sea identificado en una investigación criminal. Una consulta para identificar cualesquiera comparaciones que corresponden con la persona inicialmente puede invertirse sin ningún resultado y los datos consultados en los sistemas actuales esencialmente son desechados. Sin embargo, podría ser benéfico cargar la consulta de la misma manera como los datos recibidos, en donde los datos consultados pueden ser usados para hacer comparar con otros datos o consultas recibidas y proporcionar una mejor base para los resultados. Como tales, cualquiera o todas las emisiones y limitaciones (si se identifican aquí o no) de sistemas de creación de depósitos de datos actuales disminuye la exactitud, confiabilidad y puntualidad de la creación de depósitos de datos y dramática impide el funcionamiento. En realidad, la utilización de dichas emisiones puede ocasionar resultados inadecuados y decisiones incorrectas basándose en tales resultados. La presente invención está provista para dirigir estas y otras emisiones.

COMPENDIO DE LA INVENCION Es un objeto de la invención proporcionar un método, programa y sistema para procesar datos a y en una base de datos. El método preferiblemente comprende los pasos de: (a) recibir datos para una pluralidad de entidades, (b) utilizar un algoritmo para procesar los datos recibidos, (c) almacenar los datos procesados en la base de datos, (d) recibir consultas de datos para recuperar los datos almacenados en la base de datos, y (e) utilizar los mismos algoritmos para procesar las consultas. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, propiedades, organizaciones, proteínas u otras cosas que puedan ser representadas identificando datos. El algoritmo incluye recibir datos que han sido convertidos a un formato de mensaje estandarizado y retiene la atribución de los identificadores, tales como un sistema fuente, el valor único del sistema fuente para el identificador, un sistema de consulta y/o usuario. El procedimiento de algoritmo incluye analizar los datos antes de almacenar o consultar en la base de datos, en donde dicho paso de análisis puede incluir: (a) comparar uno o más identificadores contra un criterio definido por el usuario o uno o más grupos de datos en una base de datos, lista, u otro formato electrónico, (b) formatear el identificador de acuerdo con estándar definido por el usuario, (c) mejorar los datos antes de almacenar o consultar, consultando uno o más grupos de datos en otras bases de datos (las cuales pueden tener el mismo algoritmo como la primera base de datos y continúan buscando en una forma de cascada) o listas para identificadores adicionales para suplementar los datos recibidos con cualquier identificador adicional, (d) crear claves parásitas para los identificadores, y (d) almacenar consultas procesadas basándose en el criterio definido por el usuario, tal como un periodo especificado de tiempo. Además se contempla que el método, programa y sistema pueden incluir: (a) utilizar un algoritmo para procesador datos y comparar registros, en donde el procedimiento de algoritmo podría: (i) recuperar de la base de dados, un grupo de registros incluyendo identificadores similares a los identificadores en los datos recibidos, (ii) analizar el grupo de registros recuperado para una comparación con los datos recibidos, (¡ii) comparar los datos recibidos con los registros recibidos que son determinados para reflejar la misma entidad, (iv) analizar si cualquiera de los modos identificadores fueron agregados a cualquier registro comparado, y (v) volver a buscar los otros registros del grupo recuperado de registros para comparar con cualquier registro comparado, y (b) almacenar los registros comparados en la base de datos. Además, el algoritmo puede incluir: (a) recuperar de la base de datos, un grupo adicional de registros incluyendo identificadores similares a los identificadores en el registro comparado, (b) repetir los pasos de recuperar los registros, analizar comparaciones, comparar los mismos registros de entidad, analizar nuevos identificadores, y volver a buscar registros recuperados hasta que nos encuentren comparaciones adicionales, y (c) asignar una clave persistente a los registros. Dichos procedimientos pueden ser realizados en lote o en tiempo real. Además se contempla que el método, programa y sistema incluyen determinar si un identif icador particular es común a través de las entidades o generalmente distinto para una entidad, y separar registros previamente comparados si el identificador particular utilizado para comparar los registros es posteriormente determinado como entidades cruzadas comunes y generalmente distintivas de una entidad. Dichos pasos de determinación y separación pueden ser realizados en tiempo real o forma intermitente. Los pasos de determinación y separación pueden incluir detener cualesquiera comparaciones adicionales basándose en un identificador que se determina como una entidad cruzada común y generalmente no distintiva de una entidad, así como volver a procesar cualquier registro separado. Además se contempla que los datos recibidos son comparados con por lo menos otro registro previamente almacenado para determinar la existencia de una relación entre las entidades, y que un registro de relación se crea para cada dos entidades para las cuales existe una relación. El registro de relación puede incluir un indicador(es) de confidencia, Indicando la probabilidad de una relación entre las dos entidades o la probabilidad de que las dos identidades sean iguales. El registro de relación también puede hacer referencia a papeles de las entidades que son incluidos en los datos recibidos o asignados. Los registros de relación son analizados para determinar la existencia de cualesquiera registros relacionados previamente desconocidos basándose en la existencia de un criterio definido por el usuario. Los registros de relación reflejan un primer grado de separación, la cual puede ser analizada y navegada para incluir solamente aquellos registros que satisfacen 'un criterio predeterminado, tal como un número máximo de grados de prueba de separación o un nivel mínimo de la relación y/o indicadores de confidencia de similitud. Se puede emitir una alerta identificando el grupo de registros relacionados basándose en una regla de alerta definida por el usuario. La alerta puede ser comunicada a través de varios medios de comunicación electrónicos, tales como un mensaje de correo electrónico, una llamada telefónica, un asistente digital personal, o un mensaje de sonido corto. Además se contempla que el método puede incluir: (a) duplicar los registros de relación en una o más bases de datos, (b) distribuir los datos recibidos a una o más de las bases de datos adicionales para análisis basándose en los criterios de carga de trabajo; y (c) emitir cualquier alerta de las bases de datos adicionales. Además se contempla que el método y sistema podrían incluir transferir los datos almacenados a otra base de datos que utiliza el mismo algoritmo como la primera base de datos. Los pasos de procesar y transferir pueden ser realizados en tiempo real o en forma intermitente. Estos y otros aspectos y atributos de la presente invención serán discutidos con referencia a los siguientes dibujos y la especificación anexa.

BREVE DESCRIPCION DE LOS DIBUJOS La Figura 1 es un diagrama de bloque de un sistema de acuerdo con la presente invención; La Figura 2 es un diagrama de flujo para procesar datos en el bloque de sistema en la Figura 1; Las Figuras 3A-3C son un diagrama de flujo del bloque de Algoritmo de Procesamiento en la Figura 2; y Las Figuras 4A-4B son un diagrama de flujo de un bloque de Evaluar Registro Analizado Almacenado, en la Figura 3.

DESCRIPCION DETALLADA DE LA INVENCION Aunque esta invención es susceptible de modalidades en muchas diferentes formas, se muestra en los dibujos, y se describirá aquí con detalle, sus modalidades específicas con el entendimiento de que la presente descripción debe ser considerada como una ilustración de los principios de la invención y no pretende limitar la invención a las modalidad específicas ilustradas. Un sistema de procesamiento de datos 10 para procesar datos a y en una base de datos para recuperar 'los datos procesados se ilustra en las Figuras 1-4B. El sistema 10 incluye por lo menos una computadora convencional 12 que tiene un procesador 14 y una memoria 16. La memoria 16 se utiliza para almacenar software ejecutable para hacer operar el sistema 10, así como para almacenar los datos en una base de datos y memoria de acceso aleatorio. Sin embargo, el software puede ser almacenado o provisto en cualquier otro medio legible por computadora, tal como un CD, DVD, o disco flexible. La computadora 12 puede recibir entradas de una pluralidad de fuentes 18r 18n. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, organizaciones, propiedades, proteínas, compuestos químicos u orgánicos, estructuras biométricas o atómicas, u otras cosas que puedan ser representadas identificando datos. Los identificadores para una entidad de tipo individual pueden incluir el nombre del individuo, direcciones, números telefónicos, números de tarjeta de crédito, número de seguro social, información de empleo, viajero frecuente u otro programa de constancia, o información de cuentas. Los identificadores generalmente distintivos son aquellos que son distintivos para una entidad específica, tales como un número de seguro social para una entidad de individuo. El sistema 10 recibe los datos de la pluralidad de fuentes 18r 18n y utiliza un algoritmo 22 para procesar los datos recibidos 20. El algoritmo está almacenado en la memoria 16 y es procesado o ¡mplementado por el procesador 14.

Los datos recibidos 20 que incluyen, sin limitación, atribuciones de los datos recibidos (por ejemplo, identificación del sistema fuente), probablemente son recibidos en muchos formatos de datos. Antes de ser procesador por el algoritmo 22, los datos recibidos 20 son convertidos a un formato de mensaje estandarizado 24, tal como el Formato de Mensaje Universal. Después, como se ilustra en las Figuras 3A-3C, el algoritmo 22 recibe los datos estandarizados 26 y analiza, 28, los datos recibidos 26 antes del almacenamiento o consulta en la base de datos: (a) comparando los datos recibidos 26 con criterios o reglas definidas por el usuario para realizar varias funciones, incluyendo, sin limitación, las siguientes: (i) estandarización de nombre 30 (por ejemplo, comparando con una lista raíz de nombres), (ii) higiene de dirección 32 (por ejemplo, comparando con códigos postales de entrega), (iii) prueba o transformaciones de campo 34 (por ejemplo, comparando el campo de género para configurar M/F o transformar masculino a M, etc.) (iv) formateo definido por el usuario 36 (por ejemplo, formateo de todos los números de seguro social en un formato de 999-99-9999), (b) mejorando los datos 38 haciendo que el sistema 10 tenga acceso a una o más bases de datos 40 (las cuales pueden contener el mismo algoritmo como el de la primera base de datos, haciendo de esta manera que el sistema tenga acceso a bases de datos adicionales en una forma de cascada) para buscar información adicional (la cual puede ser emitida como datos recibidos 20), que pueden suplementar 42 los datos recibidos 26, y (c) construir claves parásitas de los datos analizados 44. Cualesquiera datos nuevos, modificados o mejorados pueden ser almacenados en campos recientemente creados para mantener la integridad de los datos originales. Por ejemplo, si el nombre "Bobby Smith" es recibido en un formato estandarizado 26, en nombre "Bobby" puede ser comparado con una lista raíz de nombres 30, estandarizado al nombre "Robert" y guardado en un campo recientemente creado para el nombre estándar. Además, si el nombre y la dirección para Bobby Smith son recibidos, 26, el sistema 10 puede tener acceso a una base de datos para encontrar personas 40 a base de Internet, convencional, para obtener el número telefónico de Bobby Smith, el cual después puede ser formateado en una forma estándar basándose en criterios definidos por el usuario 36. Además, el campo de dirección puede ser comparado con una lista de direcciones 32, dando como resultado el texto "calle" agregado al final de la dirección estandarizada. Después, se desarrollan, 44, claves parásitas basándose en los datos mejorados y almacenados en campos recientemente creados. El sistema 10 también recibe consultas 46 de la pluralidad de fuentes 18r18n y utiliza el mismo algoritmo 22 para analizar y procesar las consultas recibidas 46. Por ejemplo, si se recibe, 46, una consulta para "Bobby Smith", el mismo algoritmo 22 que estandarizó el nombre recibido de "Bobby" al nombre "Robert", también estandarizará al nombre consultado o solicitado de "Bobby" al nombre consultado o solicitado "Robert". En realidad, el sistema 10 carga y almacena consultas recibidas 46 igual que los datos recibidos 20, manteniendo la total distribución del sistema de consultas y usuario. Como tal, ya que el sistema 10 procesa las consultas recibidas 46, el algoritmo 22 puede buscar otras bases de datos 40, tales como la base de datos de registros públicos, para encontrar información faltante. Los resultados de consulta 94 pueden ser más amplios que comparaciones exactas, y pueden incluir comparaciones de relación. Por ejemplo, si la consulta es para "Bobby Smith", los resultados de consulta 94 pueden incluir registros de personas quienes han utilizado la tarjeta de crédito de Bobby Smith, o han vivido en la dirección de Bobby Smith. El algoritmo 22 también realiza una función después de recibir cualesquiera datos recibidos 26 para: (a) determinar si hay un registro existente en la base de datos que se compare con la entidad que corresponde a dichos datos recibidos, y (b) si es así, igualar los datos recibidos con el registro existente. Por ejemplo, el algoritmo recupera un grupo de registros 48 (incluyendo identificadores similares a los identificadores en los datos recibidos) de la base de datos para posibles candidatos y analiza el grupo de registros recuperados para una comparación 50 identificando un registro almacenado existente correspondiendo a los datos recibidos basándose en identificadores 52 generalmente distintivos. Si se identifica, 54, una comparación, el algoritmo analiza si el registro comparado contiene cualesquiera identificadores 56 nuevos o previamente desconocidos. Si hay identificadores 56 nuevos o previamente desconocidos, el algoritmo 22 puede analizar los ¡dentificadores 58 nuevos o previamente desconocidos, agregar o actualizar los registros de lista/relación candidatos 70 basándose en los ¡dentificadores nuevos o previamente desconocidos en el registro comparado, y determinan si existen cualesquiera comparaciones adicionales 50. Este procedimiento es repetido hasta que no se perciben comparaciones adicionales. El procedimiento de comparación después puede asignar todos los registros comparados con la misma clave persistente 60. Además, si no se encuentra ninguna comparación para algún registro, el registro sin comparación se le puede asignar su propia clave persistente 62. Los registros retienen una total atribución de los datos y el procedimiento de comparación no pierde ningún dato a través de una función de unión, purga o eliminación. Por ejemplo, si el registro #1 tiene un nombre de individuo, número telefónico y dirección, y el registro #2 tiene el mismo nombre y un número de tarjeta de crédito. Uno no sabe si son o no los mismos individuos, de manera que los registros deben ser mantenidos por separado. Después, los datos para el registro #3 son recibidos, incluyendo el nombre del individuo (igual al registro #1), dirección (igual al registro #1), número telefónico (mismo registro #1) y número de tarjeta de crédito. Ya que el nombre, número telefónico y dirección para #1 y #3 coinciden, el sistema 10 puede determinar que #1 y #3 están describiendo al mismo individuo, de manera que el algoritmo compara el registro #1 con los datos #3. El sistema 10 vuelve a correr después del algoritmo, comparando el registro comparado #1 con los otros registros de la lista de candidatos o registros adicionales que incluyen identificadores similares al registro comparado. Ya que el nombre y número de tarjeta de crédito del registro #1 comparado coincide con el nombre y el número de tarjeta de crédito del registro #2 estos dos registros también son comparados. Este registro comparado después es corrido de nuevo contra la lista de candidatos o registro adicionales recuperados buscando comparaciones 54 hasta que no se obtiene ninguna comparación. En ocasiones, el sistema 10 puede determinar que dos registros fueron incorrectamente igualados. Por ejemplo, los números de seguro social son considerados generalmente identificadores distintivos para individuos, y de esta manera los registros por lo regular coinciden basándose con el mismo número de seguro social. Sin embargo, es posible que dicho número, en ciertas circunstancias, sea determinado posteriormente como entidades cruzadas comunes y no generalmente distintivos de una entidad. Por ejemplo, considerar una operación de entrada de datos teniendo un campo de registro para números de seguro social como un campo requerido, pero el operador de entrada de datos quien no sabe el número de seguro social de los individuos meramente introduce el número "123-45-6789" para cada individuo. En tal caso, el número de seguro social podría ser un cruce común de dichas entidades de tipo individuales y ya no más ser un identif icador generalmente distintivo para estos individuos. Por consiguiente: (a) el identificador común ahora conocido puede ser agregado a una lista de identificadores comunes y todos los procedimientos futuros no intentarán recuperar registros para lista de candidatos o crear registros de relación 70 basándose en el identificador común ahora conocido, deteniendo así cualesquiera comparaciones futuras 64, y (b) cualquier registro que se igualará basándose con el número de seguro social erróneo puede necesitar ser separado para reflejar los datos antes de la comparación, requiriendo asi de ninguna pérdida de datos anteriores. Para lograr el último objetivo el sistema 10 separa cualesquiera comparaciones que ocurrieron basándose en las suposiciones incorrectas 66 con el punto antes de la suposición incorrecta de acuerdo con toda la distribución de los datos, sin ninguna pérdida de datos. De esta manera, si el registro #1 para "Bobby Smith" (el cual ha sido estandarizado a "Robert Smith") ha sido igualado con el registro #2 para "Robert Smith", y finalmente se determina que estos dos diferentes individuos, y que necesitan ser separados en los registros originales #1 y 2, el algoritmo puede identificar que el "Robert Smith está estandarizado del registro #1 era conocido como "Bobby". Además, los pasos de determinación y separación pueden ser realizados en tiempo real o en forma intermitente. Además, los registros separados pueden volver ha ser presentados como datos nuevos recibidos que serán procesados en el sistema. Existen también algunas veces cuando las relaciones, aún menores que relaciones obvias, necesitan ser evaluadas, 68. Por ejemplo, los individuos #1 y #2 cada uno puede tener una relación como una organización #3. De esta manera, es posible, tal vez probablemente, que exista una relación entre los individuos #1 y #2. Las relaciones pueden ser extendidas a varios grados de separación. Por consiguiente, el sistema 10 compara todos los datos recibidos con todos los registros en los datos recibidos y crea un registro de relación 70 para cada par de registros para los cuales existe alguna relación entre las entidades respectivas. El registro de relación 70 puede incluir tipos de relación (por ejemplo, padre, co-conspirador), los identif icadores de confidencia (los cuales son clasificaciones indicando la resistencia de relación de las dos entidades) 72 y la clave persistente asignada 60 o 62. Por ejemplo, los indicadores de confidencia 72 pueden incluir una clasificación de relación y una clasificación de similitud. La clasificación de relación es un indicador, tal como entre uno y 10, representando la probabilidad de que existe una relación entre el individuo #1 y el individuo #2. La clasificación de similitud también es un indicador, tal como entre 1 y 10, de que el individuo #1 es la misma persona que el individuo #2. Los indicadores de confidencia 72 pueden ser identificados durante el procedimiento de comparación descrito anteriormente. El sistema 10 también analiza los datos recibidos 20 y consultas 46 para determinar la existencia de una condición que satisfaga los criterios de una regla de alerta 74 definida por el usuario, tal como una relación inapropiada entre dos entidades o cierto patrón de actividades basándose en registros de relación que tienen un indicador de confidencia mayor que un . valor predeterminado y/o que tienen un registro de relación menor que un número predeterminado de grados de separación. Por ejemplo, el sistema 10 puede incluir una lista de tarjetas de crédito fraudulentas que pueden ser utilizadas para determinar si cualesquiera datos recibidos o consultas contienen un número de tarjeta de crédito que está en la lista de números de tarjeta de crédito fraudulentas. Además, la regla de alerta 74 definida por el usuario puede hacer que los datos recibidos y las consultas sean reportados. Por ejemplo, una regla de alerta puede existir si, después de introducir los datos de un nuevo vendedor, se determinó que el nuevo vendedor tenía la misma dirección a la de un empleado actual, indicando una relación entre el vendedor y el empleado que tal vez el empleado podría ser investigado. Después de la determinación de una situación- que podría activar la regla de alerta definida por el usuario, el sistema 10 emite una alerta 74, la cual puede ser comunicada a través de varios medios, tales como un mensaje a través de un correo electrónico o a un dispositivo de comunicación portátil, tal como un localizador alfanumérico, asiste digital personal o un teléfono. Por ejemplo, basándose en la regla de alerta definida por el usuario para todos los registros que tienen una probabilidad de indicador de confidencia de relación mayor que 7, 76, a un máximo de separación 78, el sistema 10: (a) iniciará con el individuo #1, (b) encontrará todos los otros individuos 80 relacionados con #1 teniendo un indicador de confidencia mayor que siete 76, (c) analizará todos los primeros grados de individuos de separación 80, y determinará a todos los individuos 82 relacionados con el primer grado de individuos de separación 80 teniendo un indicador de confidencia mayor que siete 84, y (d) repetirá el procedimiento hasta que satisfaga los 6 grados del parámetro de separación 78. El sistema podría enviar electrónicamente una alerta (que puede incluir todos los registros resultantes basándose en un criterio definido por el usuario) al sistema individual o separado relevante permitiendo una acción adicional. Además, los registros de relación 70 pueden ser duplicados a través de varias bases de datos. Al recibirlos datos recibidos 20, el sistema sistemáticamente puede evaluar la naturaleza de la carga de trabajo de cada una de las otras bases de datos y distribuir los registros comparados/relacionados/analizados a la base de datos muy probablemente para analizar de forma eficiente el registro analizado almacenado 68. Después, se pueden emitir cualesquiera alertas 74 de cualquiera de los resultados que emanan de las otras bases de datos. Finalmente, los datos procesador pueden ser transferidos, 88, a bases de datos adicionales basándose en una lista de publicación de creación de depósitos de datos 86 en cascada que puede utilizar el mismo algoritmo 92, ya sea en un procedimiento en tiempo real o intermitente. De esta manera, los datos transferidos 88 después pueden ser utilizados para compararse con datos (los cuales pueden incluir diferentes datos) en las bases de datos adicionales y cualquier base de datos subsecuente para identificar relaciones, comparaciones o procesamiento de dichos datos. Por ejemplo, los registros comparados a base de los indicadores de confidencia en una base de datos local pueden ser transferidos, 88, a la base de datos regional que será comparada e igualada con datos utilizando el mismo algoritmo 92. Después, los datos procesados que resultan de la base de datos regional pueden ser transferidos, 88, a la oficina nacional. Al combinar los datos procesados en cada paso, especialmente en tiempo real, las organizaciones o usuarios de sistemas pueden ser capaces de determinar datos inapropiados o de conflicto incitando a una acción adicional. Se puede utilizar un código de software convencional para implementar los aspectos funcionales del método, programa y sistema descritos anteriormente. El código puede ser colocado en un medio legible por computadora para utilizarse por una sola computadora o una red distribuida de computadoras, tal como el Internet. A partir de lo anterior, se observará que se pueden efectuar numerosas variaciones y modificaciones sin apartarse el espíritu y alcance de la invención. Se debe entender que no se pretende aquí o se infiere ninguna limitación con respecto al aparato especifico ilustrado. Claro que, se pretenden cubrir, a través de las reivindicaciones anexas, todas estas modificaciones para que caigan dentro del alcance de las reivindicaciones.

Claims

REIVINDICACIONES 1. - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas o preguntas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 2. - El método de acuerdo con la reivindicación 1, en donde las entidades son personas. 3.- El método de acuerdo con la reivindicación 1, en donde las entidades son propiedades personales. 4. - El método de acuerdo con la reivindicación 3, en donde la propiedad personal son vehículos. 5. - El método de acuerdo con la reivindicación 1, en donde las entidades son bienes raíces. 6. - El método de acuerdo con la reivindicación 1, en donde las entidades son organizaciones. 7. - El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos químicos. 8.- El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos orgánicos. 9. - El método de acuerdo con la reivindicación 1, en donde las entidades son proteínas. 10. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras biológicas. 11. - El método de acuerdo con la reivindicación 1, en donde las entidades son valores biométricos. 12. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras atómicas. 13.- El método de acuerdo con la reivindicación 1, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 14. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 15. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identlficador único representando cada registro en el sistema fuente. 16. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 17.- El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos. 18.- El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 19. - El método de acuerdo con la reivindicación 18, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 20. - El método de acuerdo con la reivindicación 18, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 21.- El método de acuerdo con la reivindicación 18, en donde el paso de comparar por lo menos uno de los identif icadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 22.- El método de acuerdo con la reivindicación 18, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base dé datos, incluye mejorar los datos recibidos. 23.- El método de acuerdo con la reivindicación 22, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 24.- El método de acuerdo con la reivindicación 23, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identif icadores recibidos; y suplementar los datos recibidos con los identif icadores adicionales localizados en la base de datos secundaria. 25. - El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásito de los identificadores. 26. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 27. - El método de acuerdo con la reivindicación 26, en donde el criterio definido por el usuario incluye una fecha de expiración. 28. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 29. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 30.- El método de acuerdo con la reivindicación 1 o 17, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identif icador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para una comparación con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 31.- El método de acuerdo con la reivindicación 30, en donde la comparación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 32.- El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 33. - El método de acuerdo con la reivindicación 32, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 34. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 35. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 36. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 37. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y separar registros que fueron previamente igualados, se realizan en tiempo real. 38. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 39. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 40. - El método de acuerdo con la reivindicación 39, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 41. - El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 42.- El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 43.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 44.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 45. - El método de acuerdo con la reivindicación 40, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 46. - El método de acuerdo con la reivindicación 45, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 47. - El método de acuerdo con la reivindicación 46, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 48. - El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 49.- El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 50.- El método de acuerdo con la reivindicación 45, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 51. - El método de acuerdo con la reivindicación 50, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 52. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 53. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicación electrónicos comprenden un teléfono. 54. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un localizador. 55. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 56. - El método de acuerdo con la reivindicación 50, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria . 57. - El método de acuerdo con las reivindicaciones 1 o 28, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 58. - El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 59.- El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 60 - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identif icadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada ¡dentificador del grupo recuperado de registros para realizar una comparación con: por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que- tiene ¡dentificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 61.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye asignar una clave persistente. 62. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen ¡dentificadores similares a los ¡dentificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada ¡dentificador del grupo recuperado de registros para una comparación. 63. - El método de acuerdo con la reivindicación 60 o 62, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identif icador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identif icador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identif icador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 64.- El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 65. - El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 66. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 67.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 68.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 69. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente igualados, se realizan en tiempo real. 70. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente igualados, se realizan en forma intermitente. 71.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 72.- El método de acuerdo con la reivindicación 71, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 73.- El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 74. - El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 75. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 76. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 77. - El método de acuerdo con la reivindicación 72, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 78.- El método de acuerdo con la reivindicación 77, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 79. - El método de acuerdo con la reivindicación 78, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 80. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 81. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 82. - El método de acuerdo con la reivindicación 77, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 83. - El método de acuerdo con la reivindicación 82, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 84. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 85. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicación electrónicos comprenden un teléfono. 86. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un localizador. 87. - El método de acuerdo con la rei indicación 83, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 88. - El método de acuerdo con la reivindicación 82, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 89. - El método de acuerdo con las reivindicaciones 60, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 90. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identif icadores. 91. - El método de acuerdo con la reivindicación 90, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identificador único representando cada registro en el sistema fuente. 92.- El método de acuerdo con la reivindicación 90, en donde el paso de retener una atribución de cada uno de los identif icadores incluye retener una identidad de un sistema de consulta y un usuario particular. 93. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 94. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 95.- El método de acuerdo con la reivindicación 94, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 96. - El método de acuerdo con la reivindicación 94, en donde el ¡dentificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 97. - El método de acuerdo con la reivindicación 94, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un ¡dentificador de acuerdo con el criterio definido por el usuario. 98. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 99. - El método de acuerdo con la reivindicación 98, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 100. - El método de acuerdo con la reivindicación 99, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en la base de datos secundaria. 101. - El método de acuerdo con la reivindicación 93, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 102. - El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 103.- El método de acuerdo con la reivindicación 102, en donde el criterio definido por el usuario incluye una fecha de expiración. 104.- El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 105. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 106. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 107. - Un método para separar registros previamente comparados, el método comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 108.- El método de acuerdo con la reivindicación 107, que comprende además prohibir cualesquiera comapraciones adicionales de registros basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 109.- El método de acuerdo con la reivindicación 107, que comprende además el paso de volver a procesar los registros separados. 110. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron igualados, se realizan en tiempo real. 111. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente igualados, se realizan en forma intermitente. 112.- Un registro para procesar datos en una base de datos, el método comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 113.- El método de acuerdo con la reivindicación 112, que comprende además el paso de crear por lo menos un identificador de confidencia para cada registro de relación en tiempo real. 114.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 115.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 116. - El método de acuerdo con las reivindicaciones 112 o 113, que comprende además el paso de analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 117. - El método de acuerdo con la reivindicación 116, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 118.- El método de acuerdo con la reivindicación 117, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 119.- El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 120. - El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 121. - El método de acuerdo con la reivindicación 116, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 122. - El método de acuerdo con la reivindicación 121, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 123. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 124. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicación electrónicos comprenden un teléfono. 125. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un localizador. 126. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 127. - El método de acuerdo con la reivindicación 121, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 128. - Para un sistema para procesar datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse a través de una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro de representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 129. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son personas. 130. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son propiedades personales. 131. - El medio legible por computadora de acuerdo con la reivindicación 130, en donde la propiedad personal son vehículos. 132- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son bienes raíces. 133.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son organizaciones. 134.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos químicos. 135.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos orgánicos. 136.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son proteínas. 137.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras biológicas. 138.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son valores biométricos. 139. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras atómicas. 140. - El medio legible por computadora de acuerdo con la reivindicación 128, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 141. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 142. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identif icador único representando cada registro en el sistema fuente. 143. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 144. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos.' 145. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 146.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 147.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 148. - El medio legible por computadora de acuerdo con la reivindicación 145, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 149. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 150. - El medio legible por computadora de acuerdo con la reivindicación 149, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 151.- El medio legible por computadora de acuerdo con la reivindicación 150, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los ¡dentificadores recibidos; y suplementar los datos recibidos con los ¡dentificadores adicionales localizados en una base de datos adicional. 152. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásitas de los ¡dentificadores. 153. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 154. - El medio legible por computadora de acuerdo con la reivindicación 153, en donde el criterio definido por el usuario incluye una fecha de expiración. 155. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 156. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 157.- El medio legible por computadora de acuerdo con la reivindicación 128 o 144, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para comparar con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 158.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde la igualación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 159.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 160.- El medio legible por computadora de acuerdo con la reivindicación 159, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 161.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 162. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 163. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 164. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separar registros que fueron previamente comparados, se realizan en tiempo real. 165.- El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 166.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 167.- El medio legible por computadora de acuerdo con la reivindicación 166, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 168. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 169. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 170. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 171.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son ¡guales. 172.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 173.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de analizar los registros de relación incluyen analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 174. - El medio legible por computadora de acuerdo con la reivindicación 173, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 175. - El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 176.- El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 177.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 178.- El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 179.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 180.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicación electrónicos comprenden un teléfono. 181. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un localizador. 182. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 183. - El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 184. - El medio legible por computadora de acuerdo con las reivindicaciones 128 o 155, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 185. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 186. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados, a por lo menos una base de datos secundaria se realiza en forma intermitente. 187. - Para un sistema para procesar datos a y en una base de datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identificadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identif icador del grupo recuperado de registros para realizar una comparación con. por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 188. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo para los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 189. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen identif icadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identif icador del grupo recuperado de registros para una comparación. 190. - El medio legible por computadora de acuerdo con la reivindicación 187 o 189, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 191. - El medio legible por computadora de acuerdo con la reivindicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 192. - El medio legible por computadora de acuerdo con la rei indicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 193. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 194. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 195. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 196. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente comparados, se realizan en tiempo real. 197. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 198. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 199.- El medio legible por computadora de acuerdo con la reivindicación 198, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 200.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 201. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 202. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 203. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 204.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 205.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 206. - El medio legible por computadora de acuerdo con la reivindicación 205, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 207. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 208. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 209.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 210.- El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 211. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 212. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicación electrónicos comprenden un teléfono. 213.- El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un localizador. 214. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 215. - El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 216. - El medio legible por computadora de acuerdo con las rei indicaciones 187, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 217. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identificadores . 218. - El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identif icador único representando cada registro en el sistema fuente. 219.- El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener una atribución de cada uno de los identificadores incluye retener una identidad de un sistema de consulta y un usuario particular. 220. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 221. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos y una lista . 222.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 223.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 224. - El medio legible por computadora de acuerdo con la reivindicación 221, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el criterio definido por el usuario. 225. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 226. - El medio legible por computadora de acuerdo con la reivindicación 225, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 227.- El medio legible por computadora de acuerdo con la reivindicación 226, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en por lo menos una base de datos adicional. 228.- El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 229. - El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 230. - El medio legible por computadora de acuerdo con la reivindicación 229, en donde el criterio definido por el usuario incluye una fecha de expiración. 231.- El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 232. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 233. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 234. - Para un sistema para separar registros previamente comparados, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 235. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además prohibir cualesquiera comparaciones adicionales de registros basándose en un identif ¡cador particular si el identif icador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 236. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además el paso de volver a procesar los registros separados. 237. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron comparados, se realizan en tiempo real. 238. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente comparados, se realizan en forma intermitente. 239.- Para un sistema para procesar datos en una base de datos, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identif icador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 240.- El medio legible por computadora de acuerdo con la reivindicación 239, que comprende además el paso de crear por lo menos un identif icador de confidencia para cada registro de relación en tiempo real. 241.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 242.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 243. - El medio legible por computadora de acuerdo con las reivindicaciones 239 o 240, que comprende además el paso de analizar los registro de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 244. - El medio legible por computadora de acuerdo con la reivindicación 243, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 245.- El medio legible por computadora de acuerdo con' la reivindicación 244, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 246.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 247.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 248.- El medio legible por computadora de acuerdo con la reivindicación 243, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 249.- El medio legible por computadora de acuerdo con la reivindicación 248, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 250.- El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 251. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicación electrónicos comprenden un teléfono. 252. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un localizador. 253. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 254.- El medio legible por computadora de acuerdo con la reivindicación 248, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria.