MXPA04006390A - Creacion de depositos de datos en tiempo real. - Google Patents
Creacion de depositos de datos en tiempo real.Info
- Publication number
- MXPA04006390A MXPA04006390A MXPA04006390A MXPA04006390A MXPA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A MX PA04006390 A MXPA04006390 A MX PA04006390A
- Authority
- MX
- Mexico
- Prior art keywords
- data
- records
- record
- readable medium
- relationship
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 206
- 230000008569 process Effects 0.000 claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000003860 storage Methods 0.000 claims abstract description 4
- 238000004891 communication Methods 0.000 claims description 32
- 238000000926 separation method Methods 0.000 claims description 30
- 230000002085 persistent effect Effects 0.000 claims description 11
- 239000013589 supplement Substances 0.000 claims description 9
- 230000003071 parasitic effect Effects 0.000 claims description 6
- 102000004169 proteins and genes Human genes 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- 150000002894 organic compounds Chemical class 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims 6
- 238000012958 reprocessing Methods 0.000 claims 3
- 244000045947 parasite Species 0.000 claims 1
- 230000001502 supplementing effect Effects 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000001612 separation test Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
Abstract
Se describen un metodo y sistema para procesar datos a y en una base de datos (16) y para recuperar los datos procesados. Los datos comprenden identificadores de una pluralidad de entidades (18). El metodo y sistema comprenden: a) procesar datos a y en una base de datos (16), (b) mejorar los datos recibidos (20) antes de almacenarse en una base de datos (16), (c) determinar y comparar registros basandose en relaciones entre los registros en los datos recibidos (20) produciendo datos sin perdida de datos, (d) habilitar alertas basandose en reglas y relaciones de alerta definidas por el usuario. (e) detener automaticamente comparaciones adicionales y separar las previamente comparadas cuando los identificadores usados para comparar registros son posteriormente determinados como comunes a traves de entidades y no generalmente caracteristico de una entidad, (f) recibir consultas de datos (48) para recuperar los datos procesados almacenados en la base de datos (16), (g) utilizar el mismo algoritmo para procesar las consultas (46), y (h) transferir los datos procesados a otra base de datos que utilice el mismo algoritmo.
Description
CREACION DE DEPOSITOS DE DATOS EN TIEMPO REAL
REFERENCIA CRUZADA A LAS SOLICITUDES RELACIONADAS
La presente solicitud reclama el beneficio de la solicitud provisional No. 60/344,067, presentada en la oficina de patentes de Estados Unidos el 28 de Diciembre del 2001.
FEDERALMENTE AUSPICIADA O EN DESARROLLO
No Aplicable.
CAMPO TECNICO
Esta invención se refiere a un método, programa y sistema para procesar y recuperar datos en una creación de depósitos de datos y, más particularmente, a un método, programa y sistema para el procesamiento de datos a y en una creación de depósitos de datos, a la consulta de datos en una creación de depósitos de datos, y al análisis de los datos en una creación de depósitos de datos.
ANTECEDENTES DE LA INVENCION
Las creaciones de depósitos de datos son bases de datos a base de computadora diseñadas para almacenar registros y responder a consultas o preguntas generalmente de múltiples fuentes. Los recursos corresponden con entidades, tales como individuos, organizaciones y propiedades. Cada registro contiene identificadores de la entidad, tal como, por ejemplo, nombre, dirección o información de cuenta para un individuo. Desafortunadamente, la efectividad de los sistemas de creación de depósitos de datos actuales se está disminuyendo debido a ciertas limitaciones que crean, perpetúan y/o incrementan cjerta calidad de datos, integridad y emisiones de funcionamiento. Dichas limitación también incrementan el riesgo, costo y tiempo requeridos para implementar, corregir y mantener tales sistemas. Las emisiones y limitaciones incluyen, sin limitación, las siguiente: (a) retos asociados con formatos de diferencia o de conflicto que emanan de las varias fuentes de datos, (b) datos incompletos a base de información faltante en cuanto se reciben, (c) múltiples registros introducidos que reflejan la misma entidad basándose en (por lo regular menos) discrepancias o mala ortografía, (d) capacidad insuficiente para identificar si múltiples registros están reflejando la misma entidad y/o si existe alguna relación entre los múltiples registros, (e) datos perdidos cuando dos registros determinados reflejan la misma entidad y emergen o un registro se desecha, (f) insuficiente capacidad para separar posteriormente registros cuando los registros que surgen son determinados posteriormente para reflejar dos entidades separadas, (g) capacidad insuficiente para emitir alertas basándose en reglas de alerta definidas por el usuario en tiempo real, (h) resultados inadecuados de consultas o preguntas que utilizan diferentes algoritmos o procedimientos de conversión que los algoritmos o procedimientos de conversión utilizados para procesar datos recibidos, y (i) incapacidad para mantener una consulta persistente de acuerdo con un criterio predeterminado, tal como durante cierto periodo de tiempo. Por ejemplo, cuando los identificadores de un individuo son recibidos y almacenados en una base de datos: (a) los registros de una fuente pueden hacerse disponibles en un formato delimitado con una coma, mientras que los registros de otra fuente pueden ser recibidos en otro formato de datos; (b) los datos de varios registros pueden estar faltantes, tales como un número telefónico, dirección, o alguna otra información de identificación; o (c) dos registros que reflejan al mismo individuo pueden ser recibidos en forma desconocida ya que un registro corresponde a un nombre real y otro registro corresponde a un nombre de soltero. En la última situación, el sistema puede determinar que los dos registros tienen que ser unidos o que un registro (tal vez que emana de una fuente menos confiable) sea desechado. Sin embargo, en el procedimiento de unión, los sistemas actuales típicamente abandonan datos, lo cual niega la habilidad para separar posteriormente los dos registros si se determina que los registros reflejan dos entidades separadas. Además, cuando los identificadores son recibidos y almacenados en la base de datos, la computadora puede realizar procedimientos de transformación y de mejora antes de cargar los datos a la base de datos. Sin embargo, las herramientas de consulta de sistemas actuales utilizan pocos, si hay alguno, de los procedimientos de transformación de y de mejora usados para recibir y procesar los datos recibidos, haciendo que cualesquiera resultados de tales consultas sean inconsistentes, y por lo tanto, inadecuados, insuficientes y potencialmente falsos. Similarmente, los sistemas de creación de depósitos de datos actuales no tienen las herramientas necesarias para identificar totalmente la relación entre entidades, o determinar si dichas entidades reflejan o no la misma entidad en tiempo real. Por ejemplo, un individuo puede tener la misma dirección de un segundo individuo y el segundo individuo puede tener el mismo número telefónico de un tercer individuo. En tales circunstancias, podría ser benéfico determinar la probabilidad de que el primer individuo tuviera cierta relación con el tercer individuo, especialmente en tiempo real. Además, los sistemas de creación de depósitos de datos actuales tienen la habilidad limitada para identificar relaciones inapropiadas o de conflicto entre entidades y proporcionan alertas en reglas de alerta definidas por el usuario basándose en tiempo real. Dicha habilidad limitada se basa en varios factores, incluyendo, sin limitación, la incapacidad de identificar eficiente relaciones como se indicó antes. Además, los sistemas de creación de depósitos de datos actuales primero no pueden transformar y mejorar un registro y después mantener una consulta persistente durante un periodo predeterminado. Una consulta persistente podría ser benéfica en varias circunstancias, incluyendo, sin limitación, en casos en donde el nombre de una persona sea identificado en una investigación criminal. Una consulta para identificar cualesquiera comparaciones que corresponden con la persona inicialmente puede invertirse sin ningún resultado y los datos consultados en los sistemas actuales esencialmente son desechados. Sin embargo, podría ser benéfico cargar la consulta de la misma manera como los datos recibidos, en donde los datos consultados pueden ser usados para hacer comparar con otros datos o consultas recibidas y proporcionar una mejor base para los resultados. Como tales, cualquiera o todas las emisiones y limitaciones (si se identifican aquí o no) de sistemas de creación de depósitos de datos actuales disminuye la exactitud, confiabilidad y puntualidad de la creación de depósitos de datos y dramática impide el funcionamiento. En realidad, la utilización de dichas emisiones puede ocasionar resultados inadecuados y decisiones incorrectas basándose en tales resultados. La presente invención está provista para dirigir estas y otras emisiones.
COMPENDIO DE LA INVENCION
Es un objeto de la invención proporcionar un método, programa y sistema para procesar datos a y en una base de datos. El método preferiblemente comprende los pasos de: (a) recibir datos para una pluralidad de entidades, (b) utilizar un algoritmo para procesar los datos recibidos, (c) almacenar los datos procesados en la base de datos, (d) recibir consultas de datos para recuperar los datos almacenados en la base de datos, y (e) utilizar los mismos algoritmos para procesar las consultas. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, propiedades, organizaciones, proteínas u otras cosas que puedan ser representadas identificando datos. El algoritmo incluye recibir datos que han sido convertidos a un formato de mensaje estandarizado y retiene la atribución de los identificadores, tales como un sistema fuente, el valor único del sistema fuente para el identificador, un sistema de consulta y/o usuario. El procedimiento de algoritmo incluye analizar los datos antes de almacenar o consultar en la base de datos, en donde dicho paso de análisis puede incluir: (a) comparar uno o más identificadores contra un criterio definido por el usuario o uno o más grupos de datos en una base de datos, lista, u otro formato electrónico, (b) formatear el identificador de acuerdo con estándar definido por el usuario, (c) mejorar los datos antes de almacenar o consultar, consultando uno o más grupos de datos en otras bases de datos (las cuales pueden tener el mismo algoritmo como la primera base de datos y continúan buscando en una forma de cascada) o listas para identificadores adicionales para suplementar los datos recibidos con cualquier identificador adicional, (d) crear claves parásitas para los identificadores, y (d) almacenar consultas procesadas basándose en el criterio definido por el usuario, tal como un periodo especificado de tiempo. Además se contempla que el método, programa y sistema pueden incluir: (a) utilizar un algoritmo para procesador datos y comparar registros, en donde el procedimiento de algoritmo podría:
(i) recuperar de la base de dados, un grupo de registros incluyendo identificadores similares a los identificadores en los datos recibidos,
(ii) analizar el grupo de registros recuperado para una comparación con los datos recibidos, (¡ii) comparar los datos recibidos con los registros recibidos que son determinados para reflejar la misma entidad, (iv) analizar si cualquiera de los modos identificadores fueron agregados a cualquier registro comparado, y (v) volver a buscar los otros registros del grupo recuperado de registros para comparar con cualquier registro comparado, y (b) almacenar los registros comparados en la base de datos. Además, el algoritmo puede incluir: (a) recuperar de la base de datos, un grupo adicional de registros incluyendo identificadores similares a los identificadores en el registro comparado, (b) repetir los pasos de recuperar los registros, analizar comparaciones, comparar los mismos registros de entidad, analizar nuevos identificadores, y volver a buscar registros recuperados hasta que nos encuentren comparaciones adicionales, y (c) asignar una clave persistente a los registros. Dichos procedimientos pueden ser realizados en lote o en tiempo real. Además se contempla que el método, programa y sistema incluyen determinar si un identif icador particular es común a través de las entidades o generalmente distinto para una entidad, y separar registros previamente comparados si el identificador particular utilizado para comparar los registros es posteriormente determinado como entidades cruzadas comunes y generalmente distintivas de una entidad. Dichos pasos de determinación y separación pueden ser realizados en tiempo real o forma intermitente. Los pasos de determinación y separación pueden incluir detener cualesquiera comparaciones adicionales basándose en un identificador que se determina como una entidad cruzada común y generalmente no distintiva de una entidad, así como volver a procesar cualquier registro separado. Además se contempla que los datos recibidos son comparados con por lo menos otro registro previamente almacenado para determinar la existencia de una relación entre las entidades, y que un registro de relación se crea para cada dos entidades para las cuales existe una relación. El registro de relación puede incluir un indicador(es) de confidencia, Indicando la probabilidad de una relación entre las dos entidades o la probabilidad de que las dos identidades sean iguales. El registro de relación también puede hacer referencia a papeles de las entidades que son incluidos en los datos recibidos o asignados. Los registros de relación son analizados para determinar la existencia de cualesquiera registros relacionados previamente desconocidos basándose en la existencia de un criterio definido por el usuario. Los registros de relación reflejan un primer grado de separación, la cual puede ser analizada y navegada para incluir solamente aquellos registros que satisfacen 'un criterio predeterminado, tal como un número máximo de grados de prueba de separación o un nivel mínimo de la relación y/o indicadores de confidencia de similitud. Se puede emitir una alerta identificando el grupo de registros relacionados basándose en una regla de alerta definida por el usuario. La alerta puede ser comunicada a través de varios medios de comunicación electrónicos, tales como un mensaje de correo electrónico, una llamada telefónica, un asistente digital personal, o un mensaje de sonido corto. Además se contempla que el método puede incluir: (a) duplicar los registros de relación en una o más bases de datos, (b) distribuir los datos recibidos a una o más de las bases de datos adicionales para análisis basándose en los criterios de carga de trabajo; y (c) emitir cualquier alerta de las bases de datos adicionales. Además se contempla que el método y sistema podrían incluir transferir los datos almacenados a otra base de datos que utiliza el mismo algoritmo como la primera base de datos. Los pasos de procesar y transferir pueden ser realizados en tiempo real o en forma intermitente. Estos y otros aspectos y atributos de la presente invención serán discutidos con referencia a los siguientes dibujos y la especificación anexa.
BREVE DESCRIPCION DE LOS DIBUJOS
La Figura 1 es un diagrama de bloque de un sistema de acuerdo con la presente invención; La Figura 2 es un diagrama de flujo para procesar datos en el bloque de sistema en la Figura 1; Las Figuras 3A-3C son un diagrama de flujo del bloque de
Algoritmo de Procesamiento en la Figura 2; y Las Figuras 4A-4B son un diagrama de flujo de un bloque de Evaluar Registro Analizado Almacenado, en la Figura 3.
DESCRIPCION DETALLADA DE LA INVENCION
Aunque esta invención es susceptible de modalidades en muchas diferentes formas, se muestra en los dibujos, y se describirá aquí con detalle, sus modalidades específicas con el entendimiento de que la presente descripción debe ser considerada como una ilustración de los principios de la invención y no pretende limitar la invención a las modalidad específicas ilustradas. Un sistema de procesamiento de datos 10 para procesar datos a y en una base de datos para recuperar 'los datos procesados se ilustra en las Figuras 1-4B. El sistema 10 incluye por lo menos una computadora convencional 12 que tiene un procesador 14 y una memoria 16. La memoria 16 se utiliza para almacenar software ejecutable para hacer operar el sistema 10, así como para almacenar los datos en una base de datos y memoria de acceso aleatorio. Sin embargo, el software puede ser almacenado o provisto en cualquier otro medio legible por computadora, tal como un CD, DVD, o disco flexible. La computadora 12 puede recibir entradas de una pluralidad de fuentes 18r 18n. Los datos comprenden uno o más registros que tienen uno o más identificadores representando una o más entidades. Las entidades pueden ser individuos, organizaciones, propiedades, proteínas, compuestos químicos u orgánicos, estructuras biométricas o atómicas, u otras cosas que puedan ser representadas identificando datos. Los identificadores para una entidad de tipo individual pueden incluir el nombre del individuo, direcciones, números telefónicos, números de tarjeta de crédito, número de seguro social, información de empleo, viajero frecuente u otro programa de constancia, o información de cuentas. Los identificadores generalmente distintivos son aquellos que son distintivos para una entidad específica, tales como un número de seguro social para una entidad de individuo. El sistema 10 recibe los datos de la pluralidad de fuentes 18r 18n y utiliza un algoritmo 22 para procesar los datos recibidos 20. El algoritmo está almacenado en la memoria 16 y es procesado o ¡mplementado por el procesador 14.
Los datos recibidos 20 que incluyen, sin limitación, atribuciones de los datos recibidos (por ejemplo, identificación del sistema fuente), probablemente son recibidos en muchos formatos de datos. Antes de ser procesador por el algoritmo 22, los datos recibidos 20 son convertidos a un formato de mensaje estandarizado 24, tal como el Formato de Mensaje Universal. Después, como se ilustra en las Figuras 3A-3C, el algoritmo 22 recibe los datos estandarizados 26 y analiza, 28, los datos recibidos 26 antes del almacenamiento o consulta en la base de datos: (a) comparando los datos recibidos 26 con criterios o reglas definidas por el usuario para realizar varias funciones, incluyendo, sin limitación, las siguientes: (i) estandarización de nombre 30 (por ejemplo, comparando con una lista raíz de nombres), (ii) higiene de dirección 32 (por ejemplo, comparando con códigos postales de entrega), (iii) prueba o transformaciones de campo 34 (por ejemplo, comparando el campo de género para configurar M/F o transformar masculino a M, etc.) (iv) formateo definido por el usuario 36 (por ejemplo, formateo de todos los números de seguro social en un formato de 999-99-9999), (b) mejorando los datos 38 haciendo que el sistema 10 tenga acceso a una o más bases de datos 40 (las cuales pueden contener el mismo algoritmo como el de la primera base de datos, haciendo de esta manera que el sistema tenga acceso a bases de datos adicionales en una forma de cascada) para buscar información adicional (la cual puede ser emitida como datos recibidos 20), que pueden suplementar 42 los datos recibidos 26, y (c) construir claves parásitas de los datos analizados 44. Cualesquiera datos nuevos, modificados o mejorados pueden ser almacenados en campos recientemente creados para mantener la integridad de los datos originales. Por ejemplo, si el nombre "Bobby Smith" es recibido en un formato estandarizado 26, en nombre "Bobby" puede ser comparado con una lista raíz de nombres 30, estandarizado al nombre "Robert" y guardado en un campo recientemente creado para el nombre estándar. Además, si el nombre y la dirección para Bobby Smith son recibidos, 26, el sistema 10 puede tener acceso a una base de datos para encontrar personas 40 a base de Internet, convencional, para obtener el número telefónico de Bobby Smith, el cual después puede ser formateado en una forma estándar basándose en criterios definidos por el usuario 36. Además, el campo de dirección puede ser comparado con una lista de direcciones 32, dando como resultado el texto "calle" agregado al final de la dirección estandarizada. Después, se desarrollan, 44, claves parásitas basándose en los datos mejorados y almacenados en campos recientemente creados. El sistema 10 también recibe consultas 46 de la pluralidad de fuentes 18r18n y utiliza el mismo algoritmo 22 para analizar y procesar las consultas recibidas 46. Por ejemplo, si se recibe, 46, una consulta para "Bobby Smith", el mismo algoritmo 22 que estandarizó el nombre recibido de "Bobby" al nombre "Robert", también estandarizará al nombre consultado o solicitado de "Bobby" al nombre consultado o solicitado "Robert". En realidad, el sistema 10 carga y almacena consultas recibidas 46 igual que los datos recibidos 20, manteniendo la total distribución del sistema de consultas y usuario. Como tal, ya que el sistema 10 procesa las consultas recibidas 46, el algoritmo 22 puede buscar otras bases de datos 40, tales como la base de datos de registros públicos, para encontrar información faltante. Los resultados de consulta 94 pueden ser más amplios que comparaciones exactas, y pueden incluir comparaciones de relación. Por ejemplo, si la consulta es para "Bobby Smith", los resultados de consulta 94 pueden incluir registros de personas quienes han utilizado la tarjeta de crédito de Bobby Smith, o han vivido en la dirección de Bobby Smith. El algoritmo 22 también realiza una función después de recibir cualesquiera datos recibidos 26 para: (a) determinar si hay un registro existente en la base de datos que se compare con la entidad que corresponde a dichos datos recibidos, y (b) si es así, igualar los datos recibidos con el registro existente. Por ejemplo, el algoritmo recupera un grupo de registros 48 (incluyendo identificadores similares a los identificadores en los datos recibidos) de la base de datos para posibles candidatos y analiza el grupo de registros recuperados para una comparación 50 identificando un registro almacenado existente correspondiendo a los datos recibidos basándose en identificadores 52 generalmente distintivos. Si se identifica, 54, una comparación, el algoritmo analiza si el registro comparado contiene cualesquiera identificadores 56 nuevos o previamente desconocidos. Si hay identificadores 56 nuevos o previamente desconocidos, el algoritmo 22 puede analizar los ¡dentificadores 58 nuevos o previamente desconocidos, agregar o actualizar los registros de lista/relación candidatos 70 basándose en los ¡dentificadores nuevos o previamente desconocidos en el registro comparado, y determinan si existen cualesquiera comparaciones adicionales 50. Este procedimiento es repetido hasta que no se perciben comparaciones adicionales. El procedimiento de comparación después puede asignar todos los registros comparados con la misma clave persistente 60. Además, si no se encuentra ninguna comparación para algún registro, el registro sin comparación se le puede asignar su propia clave persistente 62. Los registros retienen una total atribución de los datos y el procedimiento de comparación no pierde ningún dato a través de una función de unión, purga o eliminación. Por ejemplo, si el registro #1 tiene un nombre de individuo, número telefónico y dirección, y el registro #2 tiene el mismo nombre y un número de tarjeta de crédito. Uno no sabe si son o no los mismos individuos, de manera que los registros deben ser mantenidos por separado. Después, los datos para el registro #3 son recibidos, incluyendo el nombre del individuo (igual al registro #1), dirección (igual al registro #1), número telefónico (mismo registro #1) y número de tarjeta de crédito. Ya que el nombre, número telefónico y dirección para #1 y #3 coinciden, el sistema 10 puede determinar que #1 y #3 están describiendo al mismo individuo, de manera que el algoritmo compara el registro #1 con los datos #3. El sistema 10 vuelve a correr después del algoritmo, comparando el registro comparado #1 con los otros registros de la lista de candidatos o registros adicionales que incluyen identificadores similares al registro comparado. Ya que el nombre y número de tarjeta de crédito del registro #1 comparado coincide con el nombre y el número de tarjeta de crédito del registro #2 estos dos registros también son comparados. Este registro comparado después es corrido de nuevo contra la lista de candidatos o registro adicionales recuperados buscando comparaciones 54 hasta que no se obtiene ninguna comparación. En ocasiones, el sistema 10 puede determinar que dos registros fueron incorrectamente igualados. Por ejemplo, los números de seguro social son considerados generalmente identificadores distintivos para individuos, y de esta manera los registros por lo regular coinciden basándose con el mismo número de seguro social. Sin embargo, es posible que dicho número, en ciertas circunstancias, sea determinado posteriormente como entidades cruzadas comunes y no generalmente distintivos de una entidad. Por ejemplo, considerar una operación de entrada de datos teniendo un campo de registro para números de seguro social como un campo requerido, pero el operador de entrada de datos quien no sabe el número de seguro social de los individuos meramente introduce el número "123-45-6789" para cada individuo. En tal caso, el número de seguro social podría ser un cruce común de dichas entidades de tipo individuales y ya no más ser un identif icador generalmente distintivo para estos individuos. Por consiguiente: (a) el identificador común ahora conocido puede ser agregado a una lista de identificadores comunes y todos los procedimientos futuros no intentarán recuperar registros para lista de candidatos o crear registros de relación 70 basándose en el identificador común ahora conocido, deteniendo así cualesquiera comparaciones futuras 64, y (b) cualquier registro que se igualará basándose con el número de seguro social erróneo puede necesitar ser separado para reflejar los datos antes de la comparación, requiriendo asi de ninguna pérdida de datos anteriores. Para lograr el último objetivo el sistema 10 separa cualesquiera comparaciones que ocurrieron basándose en las suposiciones incorrectas 66 con el punto antes de la suposición incorrecta de acuerdo con toda la distribución de los datos, sin ninguna pérdida de datos. De esta manera, si el registro #1 para "Bobby Smith" (el cual ha sido estandarizado a "Robert Smith") ha sido igualado con el registro #2 para "Robert Smith", y finalmente se determina que estos dos diferentes individuos, y que necesitan ser separados en los registros originales #1 y 2, el algoritmo puede identificar que el "Robert Smith está estandarizado del registro #1 era conocido como "Bobby". Además, los pasos de determinación y separación pueden ser realizados en tiempo real o en forma intermitente. Además, los registros separados pueden volver ha ser presentados como datos nuevos recibidos que serán procesados en el sistema. Existen también algunas veces cuando las relaciones, aún menores que relaciones obvias, necesitan ser evaluadas, 68. Por ejemplo, los individuos #1 y #2 cada uno puede tener una relación como una organización #3. De esta manera, es posible, tal vez probablemente, que exista una relación entre los individuos #1 y #2. Las relaciones pueden ser extendidas a varios grados de separación. Por consiguiente, el sistema 10 compara todos los datos recibidos con todos los registros en los datos recibidos y crea un registro de relación 70 para cada par de registros para los cuales existe alguna relación entre las entidades respectivas. El registro de relación 70 puede incluir tipos de relación (por ejemplo, padre, co-conspirador), los identif icadores de confidencia (los cuales son clasificaciones indicando la resistencia de relación de las dos entidades) 72 y la clave persistente asignada 60 o 62. Por ejemplo, los indicadores de confidencia 72 pueden incluir una clasificación de relación y una clasificación de similitud. La clasificación de relación es un indicador, tal como entre uno y 10, representando la probabilidad de que existe una relación entre el individuo #1 y el individuo #2. La clasificación de similitud también es un indicador, tal como entre 1 y 10, de que el individuo #1 es la misma persona que el individuo #2. Los indicadores de confidencia 72 pueden ser identificados durante el procedimiento de comparación descrito anteriormente. El sistema 10 también analiza los datos recibidos 20 y consultas 46 para determinar la existencia de una condición que satisfaga los criterios de una regla de alerta 74 definida por el usuario, tal como una relación inapropiada entre dos entidades o cierto patrón de actividades basándose en registros de relación que tienen un indicador de confidencia mayor que un . valor predeterminado y/o que tienen un registro de relación menor que un número predeterminado de grados de separación. Por ejemplo, el sistema 10 puede incluir una lista de tarjetas de crédito fraudulentas que pueden ser utilizadas para determinar si cualesquiera datos recibidos o consultas contienen un número de tarjeta de crédito que está en la lista de números de tarjeta de crédito fraudulentas. Además, la regla de alerta 74 definida por el usuario puede hacer que los datos recibidos y las consultas sean reportados. Por ejemplo, una regla de alerta puede existir si, después de introducir los datos de un nuevo vendedor, se determinó que el nuevo vendedor tenía la misma dirección a la de un empleado actual, indicando una relación entre el vendedor y el empleado que tal vez el empleado podría ser investigado. Después de la determinación de una situación- que podría activar la regla de alerta definida por el usuario, el sistema 10 emite una alerta 74, la cual puede ser comunicada a través de varios medios, tales como un mensaje a través de un correo electrónico o a un dispositivo de comunicación portátil, tal como un localizador alfanumérico, asiste digital personal o un teléfono. Por ejemplo, basándose en la regla de alerta definida por el usuario para todos los registros que tienen una probabilidad de indicador de confidencia de relación mayor que 7, 76, a un máximo de separación 78, el sistema 10: (a) iniciará con el individuo #1, (b) encontrará todos los otros individuos 80 relacionados con #1 teniendo un indicador de confidencia mayor que siete 76, (c) analizará todos los primeros grados de individuos de separación 80, y determinará a todos los individuos 82 relacionados con el primer grado de individuos de separación 80 teniendo un indicador de confidencia mayor que siete 84, y (d) repetirá el procedimiento hasta que satisfaga los 6 grados del parámetro de separación 78. El sistema podría enviar electrónicamente una alerta (que puede incluir todos los registros resultantes basándose en un criterio definido por el usuario) al sistema individual o separado relevante permitiendo una acción adicional. Además, los registros de relación 70 pueden ser duplicados a través de varias bases de datos. Al recibirlos datos recibidos 20, el sistema sistemáticamente puede evaluar la naturaleza de la carga de trabajo de cada una de las otras bases de datos y distribuir los registros comparados/relacionados/analizados a la base de datos muy probablemente para analizar de forma eficiente el registro analizado almacenado 68. Después, se pueden emitir cualesquiera alertas 74 de cualquiera de los resultados que emanan de las otras bases de datos. Finalmente, los datos procesador pueden ser transferidos, 88, a bases de datos adicionales basándose en una lista de publicación de creación de depósitos de datos 86 en cascada que puede utilizar el mismo algoritmo 92, ya sea en un procedimiento en tiempo real o intermitente. De esta manera, los datos transferidos 88 después pueden ser utilizados para compararse con datos (los cuales pueden incluir diferentes datos) en las bases de datos adicionales y cualquier base de datos subsecuente para identificar relaciones, comparaciones o procesamiento de dichos datos. Por ejemplo, los registros comparados a base de los indicadores de confidencia en una base de datos local pueden ser transferidos, 88, a la base de datos regional que será comparada e igualada con datos utilizando el mismo algoritmo 92. Después, los datos procesados que resultan de la base de datos regional pueden ser transferidos, 88, a la oficina nacional. Al combinar los datos procesados en cada paso, especialmente en tiempo real, las organizaciones o usuarios de sistemas pueden ser capaces de determinar datos inapropiados o de conflicto incitando a una acción adicional. Se puede utilizar un código de software convencional para implementar los aspectos funcionales del método, programa y sistema descritos anteriormente. El código puede ser colocado en un medio legible por computadora para utilizarse por una sola computadora o una red distribuida de computadoras, tal como el Internet. A partir de lo anterior, se observará que se pueden efectuar numerosas variaciones y modificaciones sin apartarse el espíritu y alcance de la invención. Se debe entender que no se pretende aquí o se infiere ninguna limitación con respecto al aparato especifico ilustrado. Claro que, se pretenden cubrir, a través de las reivindicaciones anexas, todas estas modificaciones para que caigan dentro del alcance de las reivindicaciones.
Claims (1)
- REIVINDICACIONES 1. - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas o preguntas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 2. - El método de acuerdo con la reivindicación 1, en donde las entidades son personas. 3.- El método de acuerdo con la reivindicación 1, en donde las entidades son propiedades personales. 4. - El método de acuerdo con la reivindicación 3, en donde la propiedad personal son vehículos. 5. - El método de acuerdo con la reivindicación 1, en donde las entidades son bienes raíces. 6. - El método de acuerdo con la reivindicación 1, en donde las entidades son organizaciones. 7. - El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos químicos. 8.- El método de acuerdo con la reivindicación 1, en donde las entidades son compuestos orgánicos. 9. - El método de acuerdo con la reivindicación 1, en donde las entidades son proteínas. 10. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras biológicas. 11. - El método de acuerdo con la reivindicación 1, en donde las entidades son valores biométricos. 12. - El método de acuerdo con la reivindicación 1, en donde las entidades son estructuras atómicas. 13.- El método de acuerdo con la reivindicación 1, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 14. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 15. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identlficador único representando cada registro en el sistema fuente. 16. - El método de acuerdo con la reivindicación 14, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 17.- El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos. 18.- El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 19. - El método de acuerdo con la reivindicación 18, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 20. - El método de acuerdo con la reivindicación 18, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 21.- El método de acuerdo con la reivindicación 18, en donde el paso de comparar por lo menos uno de los identif icadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 22.- El método de acuerdo con la reivindicación 18, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base dé datos, incluye mejorar los datos recibidos. 23.- El método de acuerdo con la reivindicación 22, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 24.- El método de acuerdo con la reivindicación 23, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identif icadores recibidos; y suplementar los datos recibidos con los identif icadores adicionales localizados en la base de datos secundaria. 25. - El método de acuerdo con la reivindicación 17, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásito de los identificadores. 26. - El método de acuerdo con la reivindicación 1, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 27. - El método de acuerdo con la reivindicación 26, en donde el criterio definido por el usuario incluye una fecha de expiración. 28. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 29. - El método de acuerdo con la reivindicación 1, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 30.- El método de acuerdo con la reivindicación 1 o 17, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identif icador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para una comparación con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 31.- El método de acuerdo con la reivindicación 30, en donde la comparación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 32.- El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 33. - El método de acuerdo con la reivindicación 32, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 34. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 35. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 36. - El método de acuerdo con la reivindicación 34, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 37. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y separar registros que fueron previamente igualados, se realizan en tiempo real. 38. - El método de acuerdo con la reivindicación 34, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 39. - El método de acuerdo con la reivindicación 30, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 40. - El método de acuerdo con la reivindicación 39, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 41. - El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 42.- El método de acuerdo con la reivindicación 40, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 43.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 44.- El método de acuerdo con la reivindicación 40, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 45. - El método de acuerdo con la reivindicación 40, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 46. - El método de acuerdo con la reivindicación 45, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 47. - El método de acuerdo con la reivindicación 46, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 48. - El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 49.- El método de acuerdo con la reivindicación 47, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 50.- El método de acuerdo con la reivindicación 45, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 51. - El método de acuerdo con la reivindicación 50, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 52. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 53. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicación electrónicos comprenden un teléfono. 54. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un localizador. 55. - El método de acuerdo con la reivindicación 51, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 56. - El método de acuerdo con la reivindicación 50, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria . 57. - El método de acuerdo con las reivindicaciones 1 o 28, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 58. - El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 59.- El método de acuerdo con la reivindicación 57, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 60 - Un método para procesar datos, que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identif icadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada ¡dentificador del grupo recuperado de registros para realizar una comparación con: por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que- tiene ¡dentificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 61.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye asignar una clave persistente. 62. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen ¡dentificadores similares a los ¡dentificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene ¡dentificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada ¡dentificador del grupo recuperado de registros para una comparación. 63. - El método de acuerdo con la reivindicación 60 o 62, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identif icador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identif icador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identif icador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 64.- El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 65. - El método de acuerdo con la reivindicación 63, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 66. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 67.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 68.- El método de acuerdo con la reivindicación 66, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 69. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente igualados, se realizan en tiempo real. 70. - El método de acuerdo con la reivindicación 66, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente igualados, se realizan en forma intermitente. 71.- El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 72.- El método de acuerdo con la reivindicación 71, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 73.- El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 74. - El método de acuerdo con la reivindicación 72, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 75. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 76. - El método de acuerdo con la reivindicación 72, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 77. - El método de acuerdo con la reivindicación 72, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 78.- El método de acuerdo con la reivindicación 77, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 79. - El método de acuerdo con la reivindicación 78, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 80. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 81. - El método de acuerdo con la reivindicación 79, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 82. - El método de acuerdo con la reivindicación 77, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 83. - El método de acuerdo con la reivindicación 82, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 84. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 85. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicación electrónicos comprenden un teléfono. 86. - El método de acuerdo con la reivindicación 83, en donde los medios de comunicaciones electrónicos comprenden un localizador. 87. - El método de acuerdo con la rei indicación 83, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 88. - El método de acuerdo con la reivindicación 82, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 89. - El método de acuerdo con las reivindicaciones 60, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 90. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identif icadores. 91. - El método de acuerdo con la reivindicación 90, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identificador único representando cada registro en el sistema fuente. 92.- El método de acuerdo con la reivindicación 90, en donde el paso de retener una atribución de cada uno de los identif icadores incluye retener una identidad de un sistema de consulta y un usuario particular. 93. - El método de acuerdo con la reivindicación 60, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 94. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identif icadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 95.- El método de acuerdo con la reivindicación 94, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 96. - El método de acuerdo con la reivindicación 94, en donde el ¡dentificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 97. - El método de acuerdo con la reivindicación 94, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un ¡dentificador de acuerdo con el criterio definido por el usuario. 98. - El método de acuerdo con la reivindicación 93, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 99. - El método de acuerdo con la reivindicación 98, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos secundaria y la lista para identif icadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identif icadores adicionales. 100. - El método de acuerdo con la reivindicación 99, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos secundaria utilizando el algoritmo para consultar bases de datos adicionales para localizar identif icadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en la base de datos secundaria. 101. - El método de acuerdo con la reivindicación 93, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 102. - El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 103.- El método de acuerdo con la reivindicación 102, en donde el criterio definido por el usuario incluye una fecha de expiración. 104.- El método de acuerdo con la reivindicación 60, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 105. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 106. - El método de acuerdo con la reivindicación 104, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 107. - Un método para separar registros previamente comparados, el método comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente comparados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 108.- El método de acuerdo con la reivindicación 107, que comprende además prohibir cualesquiera comapraciones adicionales de registros basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 109.- El método de acuerdo con la reivindicación 107, que comprende además el paso de volver a procesar los registros separados. 110. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron igualados, se realizan en tiempo real. 111. - El método de acuerdo con la reivindicación 107, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente igualados, se realizan en forma intermitente. 112.- Un registro para procesar datos en una base de datos, el método comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 113.- El método de acuerdo con la reivindicación 112, que comprende además el paso de crear por lo menos un identificador de confidencia para cada registro de relación en tiempo real. 114.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 115.- El método de acuerdo con la reivindicación 113, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 116. - El método de acuerdo con las reivindicaciones 112 o 113, que comprende además el paso de analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 117. - El método de acuerdo con la reivindicación 116, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 118.- El método de acuerdo con la reivindicación 117, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 119.- El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 120. - El método de acuerdo con la reivindicación 118, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 121. - El método de acuerdo con la reivindicación 116, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 122. - El método de acuerdo con la reivindicación 121, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 123. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 124. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicación electrónicos comprenden un teléfono. 125. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un localizador. 126. - El método de acuerdo con la reivindicación 122, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 127. - El método de acuerdo con la reivindicación 121, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 128. - Para un sistema para procesar datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse a través de una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro de representando por lo menos una de una pluralidad de entidades; utilizar un algoritmo para procesar los datos recibidos; almacenar los datos procesados en una base de datos; recibir consultas de datos para recuperar por lo menos una porción de los datos almacenados en la base de datos; y utilizar el algoritmo para procesar las consultas. 129. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son personas. 130. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son propiedades personales. 131. - El medio legible por computadora de acuerdo con la reivindicación 130, en donde la propiedad personal son vehículos. 132- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son bienes raíces. 133.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son organizaciones. 134.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos químicos. 135.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son compuestos orgánicos. 136.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son proteínas. 137.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras biológicas. 138.- El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son valores biométricos. 139. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde las entidades son estructuras atómicas. 140. - El medio legible por computadora de acuerdo con la reivindicación 128, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes de utilizar un algoritmo para procesar los datos recibidos. 141. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye retener una atribución de cada registro. 142. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro; y un identif icador único representando cada registro en el sistema fuente. 143. - El medio legible por computadora de acuerdo con la reivindicación 141, en donde el paso de retener una atribución de cada registro incluye retener una identidad de un sistema de consulta y un usuario particular. 144. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye analizar los datos recibidos antes de un almacenamiento en la base de datos y consulta en la base de datos.' 145. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos secundaria y una lista. 146.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 147.- El medio legible por computadora de acuerdo con la reivindicación 145, en donde el identif icador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 148. - El medio legible por computadora de acuerdo con la reivindicación 145, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el estándar definido por el usuario. 149. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 150. - El medio legible por computadora de acuerdo con la reivindicación 149, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 151.- El medio legible por computadora de acuerdo con la reivindicación 150, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los ¡dentificadores recibidos; y suplementar los datos recibidos con los ¡dentificadores adicionales localizados en una base de datos adicional. 152. - El medio legible por computadora de acuerdo con la reivindicación 144, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos y se consulten en la base de datos, incluye crear claves parásitas de los ¡dentificadores. 153. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye almacenar en la base de datos, consultas procesadas basándose en un criterio definido por el usuario. 154. - El medio legible por computadora de acuerdo con la reivindicación 153, en donde el criterio definido por el usuario incluye una fecha de expiración. 155. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de identidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesador en una base de datos, se realizan en tiempo real. 156. - El medio legible por computadora de acuerdo con la reivindicación 128, en donde los pasos de recibir datos que comprenden por lo menos un registro que tiene por lo menos un identificador, cada registro representando por lo menos una de una pluralidad de entidades, utilizar un algoritmo para procesar los datos recibidos, y almacenar los datos procesado en una base de datos, se realizan en forma intermitente. 157.- El medio legible por computadora de acuerdo con la reivindicación 128 o 144, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: recuperar de la base de datos, un grupo de registros adicionales que tienen identificadores similares a los identificadores en los datos recibidos; analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identificador del grupo recuperado de registros para comparar con: por lo menos una porción de los datos recibidos, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identificadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 158.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde la igualación de por lo menos una porción de los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 159.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende recuperar de la base de datos, un grupo adicional de registros que tienen identificadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identificador del grupo recuperado de registros para una comparación. 160.- El medio legible por computadora de acuerdo con la reivindicación 159, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 161.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina después de una primera ocurrencia como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 162. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye prohibir cualesquiera comparaciones adicionales basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 163. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye volver a procesar los registros separados como datos recibidos. 164. - El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separar registros que fueron previamente comparados, se realizan en tiempo real. 165.- El medio legible por computadora de acuerdo con la reivindicación 161, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 166.- El medio legible por computadora de acuerdo con la reivindicación 157, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 167.- El medio legible por computadora de acuerdo con la reivindicación 166, en donde el paso de utilizar un algoritmo para procesar los datos recibidos incluye crear por lo menos un indicador de confidencia para cada registro de relación. 168. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 169. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 170. - El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 171.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son ¡guales. 172.- El medio legible por computadora de acuerdo con la reivindicación 167, en donde el paso de utilizar un algoritmo para procesar datos recibidos incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 173.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de analizar los registros de relación incluyen analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 174. - El medio legible por computadora de acuerdo con la reivindicación 173, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 175. - El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 176.- El medio legible por computadora de acuerdo con la reivindicación 174, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 177.- El medio legible por computadora de acuerdo con la reivindicación 172, en donde el paso de utilizar un algoritmo para procesar datos recibidos además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 178.- El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 179.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 180.- El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicación electrónicos comprenden un teléfono. 181. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un localizador. 182. - El medio legible por computadora de acuerdo con la reivindicación 178, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 183. - El medio legible por computadora de acuerdo con la reivindicación 177, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 184. - El medio legible por computadora de acuerdo con las reivindicaciones 128 o 155, en donde el paso de utilizar un algoritmo para procesar los datos recibidos además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 185. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 186. - El medio legible por computadora de acuerdo con la reivindicación 184, en donde el paso de transferir los datos procesados almacenados, a por lo menos una base de datos secundaria se realiza en forma intermitente. 187. - Para un sistema para procesar datos a y en una base de datos y un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene al menos un identificador, cada registro representando por lo menos una pluralidad de entidades; utilizar un algoritmo para: recuperar, de una base de datos, un grupo de registros adicionales teniendo identificadores similares a los identificadores en los datos recibidos, analizar cada identificador del grupo recuperado de registros para una comparación con por lo menos una porción de los datos recibidos; comparar por lo menos una porción de los datos recibidos con por lo menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; analizar si por lo menos un identificador está incluido en al menos una porción de los datos recibidos que previamente no fueron almacenados en al menos un registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identif icadores representando una entidad idéntica de la pluralidad de entidades; y volver a analizar cada identif icador del grupo recuperado de registros para realizar una comparación con. por lo menos una porción de los datos recuperados, y el registro de analizado del grupo recuperado de registros que se determina que refleja un registro que tiene identif icadores que representan una entidad idéntica de la pluralidad de entidades; y almacenar los registros comparados en la base de datos. 188. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo para los datos recibidos con por lo menos un registro analizado incluye asignar una clave persistente. 189. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo además comprende recuperar, de la base de la base de datos, un grupo adicional de registros que tienen identif icadores similares a los identificadores en: por lo menos una porción de los datos recibidos, y el registro analizado del grupo recuperado de registros que se determina para reflejar un registro que tiene identificadores representando una entidad idéntica de la pluralidad de entidades; antes de volver a analizar cada identif icador del grupo recuperado de registros para una comparación. 190. - El medio legible por computadora de acuerdo con la reivindicación 187 o 189, en donde la utilización de un algoritmo para procesar los datos recibidos incluye repetir: la recuperación de la base de datos de un grupo registros adicionales; el análisis de cada identificador del grupo recuperado de registros; la comparación de por lo menos una porción de los datos recibidos; el análisis de que si por lo menos un identificador está incluido en por lo menos una porción de los datos recibidos y que no fueron previamente almacenados; la recuperación, de la base de datos, de un grupo adicional de registros; y volver a analizar cada identificador del grupo recuperado de registros para una comparación hasta que no se determina ninguna comparación adicional. 191. - El medio legible por computadora de acuerdo con la reivindicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se realizan en tiempo real. 192. - El medio legible por computadora de acuerdo con la rei indicación 190, en donde los pasos de recibir datos, utilizar un algoritmo y almacenar los registros comparados se registran en forma intermitente. 193. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: determinar si un identificador particular es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 194. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye proporcionar cualesquiera comparaciones adicionales de recursos basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y no generalmente distintivo de un registro que representa una entidad particular. 195. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde el paso de utilizar un algoritmo incluye volver a procesar los registros separados como datos recibidos. 196. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de los registros cruzados comunes que representan por lo menos dos diferentes entidades y generalmente son distintivos de un registro que representa una entidad particular y de separación de registros que fueron previamente comparados, se realizan en tiempo real. 197. - El medio legible por computadora de acuerdo con la reivindicación 193, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro que representa una entidad particular, y de separar registros que fueron previamente comparados, se realizan en forma intermitente. 198. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye: comparar los datos recibidos con por lo menos un registro almacenado para determinar la existencia de una relación; y crear un registro de relación para cada registro almacenado determinado para reflejar una relación con por lo menos una porción de los datos recibidos. 199.- El medio legible por computadora de acuerdo con la reivindicación 198, en donde el paso de utilizar un algoritmo incluye crear por lo menos un indicador de confidencia para cada registro de relación. 200.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en tiempo real. 201. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde los pasos de comparar los datos recibidos, crear un registro de relación, y crear por lo menos un indicador de confidencia, se realizan en forma intermitente. 202. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 203. - El medio legible por computadora de acuerdo con la reivindicación 199, en donde por lo menos uno de los indicadores de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 204.- El medio legible por computadora de acuerdo con la reivindicación 199, en donde el paso de utilizar un algoritmo incluye analizar los registros de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 205.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de analizar los registros de relación incluye analizar registros de relación que reflejan por lo menos un nivel de los grados de separación. 206. - El medio legible por computadora de acuerdo con la reivindicación 205, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación, incluye analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario. 207. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 208. - El medio legible por computadora de acuerdo con la reivindicación 206, en donde el paso de analizar registros de relación que satisfacen un criterio definido por el usuario, incluye limitar los registros de relación analizados para los registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 209.- El medio legible por computadora de acuerdo con la reivindicación 204, en donde el paso de utilizar un algoritmo además comprende emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario. 210.- El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario, incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 211. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 212. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicación electrónicos comprenden un teléfono. 213.- El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un localizador. 214. - El medio legible por computadora de acuerdo con la reivindicación 210, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 215. - El medio legible por computadora de acuerdo con la reivindicación 209, en donde el paso de analizar los registros de relación incluye: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria. 216. - El medio legible por computadora de acuerdo con las rei indicaciones 187, que comprende además el paso de convertir los datos recibidos a un formato de mensaje estandarizado antes del paso de utilizar un algoritmo. 217. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye retener una atribución de cada uno de los identificadores . 218. - El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener la atribución de cada registro incluye retener una identidad de: un sistema fuente proporcionando cada registro y un identif icador único representando cada registro en el sistema fuente. 219.- El medio legible por computadora de acuerdo con la reivindicación 217, en donde el paso de retener una atribución de cada uno de los identificadores incluye retener una identidad de un sistema de consulta y un usuario particular. 220. - El medio legible por computadora de acuerdo con la reivindicación 187, en donde el paso de utilizar un algoritmo incluye analizar los datos recibidos antes de que se almacenen en la base de datos y la consulta en la base de datos. 221. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibos antes de que se almacene en la base de datos y se consulten en la base de datos, incluye comparar por lo menos uno de los identificadores contra uno de: un criterio definido por el usuario, y por lo menos un grupo de datos en una de una base de datos y una lista . 222.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es un nombre de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista raíz de nombres. 223.- El medio legible por computadora de acuerdo con la reivindicación 221, en donde el identificador comparado es una dirección de por lo menos una de la pluralidad de entidades y el grupo de datos está en una lista de direcciones. 224. - El medio legible por computadora de acuerdo con la reivindicación 221, en donde el paso de comparar por lo menos uno de los identificadores contra un criterio definido por el usuario incluye formatear por lo menos un identificador de acuerdo con el criterio definido por el usuario. 225. - El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de analizar los datos recibidos antes de que se almacenen en la base de datos o se consulten en la base de datos, incluye mejorar los datos recibidos. 226. - El medio legible por computadora de acuerdo con la reivindicación 225, en donde el paso de mejorar los datos recibidos incluye: consultar por lo menos un grupo de datos en una de la base de datos y la lista para identificadores adicionales para los datos recibidos, y suplementar los datos recibidos con los identificadores adicionales. 227.- El medio legible por computadora de acuerdo con la reivindicación 226, en donde el paso de consultar por lo menos un grupo de datos incluye: por lo menos un grupo de datos que está en la base de datos utilizando el algoritmo para consultar bases de datos adicionales para localizar identificadores adicionales con relación a por lo menos uno de los identificadores recibidos; y suplementar los datos recibidos con los identificadores adicionales localizados en por lo menos una base de datos adicional. 228.- El medio legible por computadora de acuerdo con la reivindicación 220, en donde el paso de utilizar un algoritmo incluye claves parásitas de los identificadores. 229. - El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo incluye almacenar, en la base de datos, consultas procesadas basándose en un criterio definido por un usuario. 230. - El medio legible por computadora de acuerdo con la reivindicación 229, en donde el criterio definido por el usuario incluye una fecha de expiración. 231.- El medio legible por computadora de acuerdo con la reivindicación 187, el paso de utilizar un algoritmo además comprende transferir los datos procesados almacenados a por lo menos una base de datos secundaria utilizando el algoritmo. 232. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en tiempo real. 233. - El medio legible por computadora de acuerdo con la reivindicación 231, en donde el paso de transferir los datos procesados almacenados a por lo menos una base de datos secundaria se realiza en forma intermitente. 234. - Para un sistema para separar registros previamente comparados, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: determinar si un identificador particular en por lo menos un registro que representa por lo menos una entidad, es uno de: registros cruzados comunes representando por lo menos dos diferentes entidades, y generalmente distintivos de un registro que representa una entidad particular; y separar los registros que fueron previamente igualados basándose en un identificador particular, si el identificador particular se determina como un registro cruzado común representando por lo menos dos diferentes entidades y generalmente no distintivo de un registro que representa una entidad particular. 235. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además prohibir cualesquiera comparaciones adicionales de registros basándose en un identif ¡cador particular si el identif icador particular se determina como un registro cruzado común representado una pluralidad de entidades y generalmente no distintivo de un registro que representa una entidad. 236. - El medio legible por computadora de acuerdo con la reivindicación 234, que comprende además el paso de volver a procesar los registros separados. 237. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos entidades diferentes y generalmente distintivos de un registro representando una entidad particular, y de separar registros que previamente fueron comparados, se realizan en tiempo real. 238. - El medio legible por computadora de acuerdo con la reivindicación 234, en donde los pasos de determinar si un identificador particular es uno de registros cruzados comunes representando por lo menos dos diferentes entidades y generalmente distintivos de un registro que representa una entidad particular, y de separar que fueron previamente comparados, se realizan en forma intermitente. 239.- Para un sistema para procesar datos en una base de datos, un medio legible por computadora que contiene instrucciones de programa para ejecutarse por una computadora para realizar el método que comprende los pasos de: recibir datos que comprenden por lo menos un registro que tiene por lo menos un identif icador, cada registro representando por lo menos una de una pluralidad de entidades; comparar los datos recibidos con al menos un registro almacenado en una base de datos para determinar la existencia de una relación en tiempo real; crear un registro de relación para cada registro almacenado en una base de datos determinado para reflejar una relación con al menos una porción de los datos recibidos en tiempo real; y almacenar cada registro de relación en la base de datos. 240.- El medio legible por computadora de acuerdo con la reivindicación 239, que comprende además el paso de crear por lo menos un identif icador de confidencia para cada registro de relación en tiempo real. 241.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de una relación entre: una entidad representada por el registro particular que tiene una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos. 242.- El medio legible por computadora de acuerdo con la reivindicación 240, en donde por lo menos un indicador de confidencia indica la probabilidad de que: una entidad representada por el registro particular teniendo una relación con la porción de los datos recibidos, y una entidad representada por la porción de los datos recibidos, son iguales. 243. - El medio legible por computadora de acuerdo con las reivindicaciones 239 o 240, que comprende además el paso de analizar los registro de relación para determinar si los registros de relación reflejan por lo menos una relación no previamente determinada. 244. - El medio legible por computadora de acuerdo con la reivindicación 243, en donde el paso de analizar los registros de relación incluye analizar los registros de relación que reflejan por lo menos un nivel de grado de separación. 245.- El medio legible por computadora de acuerdo con' la reivindicación 244, en donde el paso de analizar registros de relación que reflejan por lo menos un nivel de grados de separación incluye analizar los registros de relación que satisfacen por lo menos un criterio definido por un usuario. 246.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados a un nivel máximo de grados de separación. 247.- El medio legible por computadora de acuerdo con la reivindicación 245, en donde el paso de analizar registros de relación que satisfacen por lo menos un criterio definido por el usuario incluye limitar los registros de relación analizados para registros de relación que incluyen indicadores de confidencia mayores que una cantidad mínima. 248.- El medio legible por computadora de acuerdo con la reivindicación 243, que comprende además el paso de emitir una alerta basándose por lo menos en una regla de alerta definida por el usuario. 249.- El medio legible por computadora de acuerdo con la reivindicación 248, en donde el paso de emitir una alerta basándose en por lo menos una regla de alerta definida por el usuario incluye tener la alerta comunicada a través de medios de comunicación electrónicos. 250.- El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un sistema de correo electrónico. 251. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicación electrónicos comprenden un teléfono. 252. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un localizador. 253. - El medio legible por computadora de acuerdo con la reivindicación 249, en donde los medios de comunicaciones electrónicos comprenden un asistente digital personal. 254.- El medio legible por computadora de acuerdo con la reivindicación 248, que comprende además el paso de: duplicar los registros de relación en por lo menos una base de datos secundaria; distribuir los datos recibidos a por lo menos esa base de datos secundaria para análisis basándose en un criterio de carga de trabajo; y emitir la alerta que satisface los criterios de una regla de alerta definida por el usuario de por lo menos una base de datos secundaria.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US34406701P | 2001-12-28 | 2001-12-28 | |
PCT/US2002/041630 WO2003058427A1 (en) | 2001-12-28 | 2002-12-27 | Real time data warehousing |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA04006390A true MXPA04006390A (es) | 2005-06-08 |
Family
ID=23348900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA04006390A MXPA04006390A (es) | 2001-12-28 | 2002-12-27 | Creacion de depositos de datos en tiempo real. |
Country Status (14)
Country | Link |
---|---|
US (2) | US8452787B2 (es) |
EP (1) | EP1470475A4 (es) |
JP (3) | JP2006501529A (es) |
KR (3) | KR100850255B1 (es) |
CN (2) | CN101324902A (es) |
AU (1) | AU2002367376A1 (es) |
BR (1) | BR0215411A (es) |
CA (1) | CA2471940C (es) |
EA (1) | EA200400873A1 (es) |
IL (1) | IL162746A0 (es) |
MX (1) | MXPA04006390A (es) |
PL (1) | PL374305A1 (es) |
WO (1) | WO2003058427A1 (es) |
ZA (1) | ZA200405141B (es) |
Families Citing this family (158)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100850255B1 (ko) | 2001-12-28 | 2008-08-19 | 인터내셔널 비지네스 머신즈 코포레이션 | 실시간 데이터 웨어하우징 |
US7200619B2 (en) * | 2002-05-31 | 2007-04-03 | International Business Machines Corporation | Method and process to optimize correlation of replicated with extracted data from disparate data sources |
US7900052B2 (en) | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
US7346927B2 (en) | 2002-12-12 | 2008-03-18 | Access Business Group International Llc | System and method for storing and accessing secure data |
US8620937B2 (en) * | 2002-12-27 | 2013-12-31 | International Business Machines Corporation | Real time data warehousing |
WO2004061668A1 (en) | 2002-12-31 | 2004-07-22 | International Business Machines Corporation | Authorized anonymous authentication |
WO2004097596A2 (en) * | 2003-03-24 | 2004-11-11 | Systems Research & Development | Secure coordinate identification method, system and program |
US7069308B2 (en) * | 2003-06-16 | 2006-06-27 | Friendster, Inc. | System, method and apparatus for connecting users in an online computer system based on their relationships within social networks |
US7747638B1 (en) * | 2003-11-20 | 2010-06-29 | Yahoo! Inc. | Techniques for selectively performing searches against data and providing search results |
AR047362A1 (es) * | 2003-12-31 | 2006-01-18 | Thomson Global Resources Ag | Sistemas, metodos, interfases y software para recoleccion automatizada e integracion de datos de entidades en bases de datos y directorios profesionales en linea. |
US8572221B2 (en) | 2004-05-26 | 2013-10-29 | Facebook, Inc. | System and method for managing an online social network |
US8010458B2 (en) * | 2004-05-26 | 2011-08-30 | Facebook, Inc. | System and method for managing information flow between members of an online social network |
US7788260B2 (en) * | 2004-06-14 | 2010-08-31 | Facebook, Inc. | Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation |
US7478078B2 (en) * | 2004-06-14 | 2009-01-13 | Friendster, Inc. | Method for sharing relationship information stored in a social network database with third party databases |
US10373173B2 (en) * | 2004-06-14 | 2019-08-06 | Facebook, Inc. | Online content delivery based on information from social networks |
US8161184B2 (en) * | 2004-06-25 | 2012-04-17 | Apple Inc. | Method and apparatus for facilitating long-lived DNS queries |
US8302164B2 (en) | 2004-07-22 | 2012-10-30 | Facebook, Inc. | Authorization and authentication based on an individual's social network |
US7606687B2 (en) | 2004-09-14 | 2009-10-20 | Friendster, Inc. | Proximity search methods using tiles to represent geographical zones |
US20060085373A1 (en) * | 2004-09-30 | 2006-04-20 | Dhillion Jasjit S | Method and apparatus for creating relationships over a network |
US7451161B2 (en) | 2005-04-28 | 2008-11-11 | Friendster, Inc. | Compatibility scoring of users in a social network |
US9792351B2 (en) * | 2005-06-10 | 2017-10-17 | International Business Machines Corporation | Tolerant and extensible discovery of relationships in data using structural information and data analysis |
WO2007030685A2 (en) * | 2005-09-09 | 2007-03-15 | Robert Howe Pinckney | Method and system for message storage and retrieval |
CN100396002C (zh) * | 2005-11-23 | 2008-06-18 | 华为技术有限公司 | 一种利用关联查询进行鉴权的系统及其方法 |
US8204831B2 (en) | 2006-11-13 | 2012-06-19 | International Business Machines Corporation | Post-anonymous fuzzy comparisons without the use of pre-anonymization variants |
US10452763B2 (en) * | 2007-03-08 | 2019-10-22 | Oath Inc. | Autocomplete for integrating diverse methods of electronic communication |
US9372909B2 (en) | 2007-05-15 | 2016-06-21 | Paypal, Inc. | Defining a set of data across mutiple databases using variables and functions |
US8156158B2 (en) * | 2007-07-18 | 2012-04-10 | Famillion Ltd. | Method and system for use of a database of personal data records |
DE102007057248A1 (de) * | 2007-11-16 | 2009-05-20 | T-Mobile International Ag | Verbindungsschicht für Datenbanken |
US10733223B2 (en) * | 2008-01-08 | 2020-08-04 | International Business Machines Corporation | Term-driven records file plan and thesaurus design |
CN101277272B (zh) * | 2008-05-16 | 2010-12-15 | 北京航空航天大学 | 一种海量广播数据入库的实现方法 |
WO2010063311A1 (en) * | 2008-12-02 | 2010-06-10 | Telefonaktiebolaget L M Ericsson (Publ) | System and method for matching entities |
US8359337B2 (en) * | 2008-12-09 | 2013-01-22 | Ingenix, Inc. | Apparatus, system and method for member matching |
US9910875B2 (en) * | 2008-12-22 | 2018-03-06 | International Business Machines Corporation | Best-value determination rules for an entity resolution system |
US8732176B2 (en) * | 2009-04-28 | 2014-05-20 | Palo Alto Research Center Incorporated | Web-based tool for detecting bias in reviews |
US9727842B2 (en) | 2009-08-21 | 2017-08-08 | International Business Machines Corporation | Determining entity relevance by relationships to other relevant entities |
US8423525B2 (en) | 2010-03-30 | 2013-04-16 | International Business Machines Corporation | Life arcs as an entity resolution feature |
US9110968B2 (en) | 2010-04-14 | 2015-08-18 | At&T Intellectual Property I, L.P. | Removal of invisible data packages in data warehouses |
US8572129B1 (en) | 2010-04-19 | 2013-10-29 | Facebook, Inc. | Automatically generating nodes and edges in an integrated social graph |
US9262482B2 (en) | 2010-04-19 | 2016-02-16 | Facebook, Inc. | Generating default search queries on online social networks |
US9092485B2 (en) | 2010-04-19 | 2015-07-28 | Facebook, Inc. | Dynamic suggested search queries on online social networks |
US8180804B1 (en) | 2010-04-19 | 2012-05-15 | Facebook, Inc. | Dynamically generating recommendations based on social graph information |
US9223838B2 (en) | 2010-04-19 | 2015-12-29 | Facebook, Inc. | Sponsored search queries on online social networks |
US8185558B1 (en) | 2010-04-19 | 2012-05-22 | Facebook, Inc. | Automatically generating nodes and edges in an integrated social graph |
US8751521B2 (en) | 2010-04-19 | 2014-06-10 | Facebook, Inc. | Personalized structured search queries for online social networks |
US8918418B2 (en) | 2010-04-19 | 2014-12-23 | Facebook, Inc. | Default structured search queries on online social networks |
US9275119B2 (en) | 2010-04-19 | 2016-03-01 | Facebook, Inc. | Sharing search queries on online social network |
US8732208B2 (en) | 2010-04-19 | 2014-05-20 | Facebook, Inc. | Structured search queries based on social-graph information |
US10402419B1 (en) | 2010-04-19 | 2019-09-03 | Facebook, Inc. | Search queries with previews of search results on online social networks |
US9633121B2 (en) | 2010-04-19 | 2017-04-25 | Facebook, Inc. | Personalizing default search queries on online social networks |
US9275101B2 (en) | 2010-04-19 | 2016-03-01 | Facebook, Inc. | Search queries with previews of search results on online social networks |
US8868603B2 (en) | 2010-04-19 | 2014-10-21 | Facebook, Inc. | Ambiguous structured search queries on online social networks |
US8782080B2 (en) | 2010-04-19 | 2014-07-15 | Facebook, Inc. | Detecting social graph elements for structured search queries |
CN102314460B (zh) * | 2010-07-07 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 数据分析方法、系统及服务器 |
US8468119B2 (en) * | 2010-07-14 | 2013-06-18 | Business Objects Software Ltd. | Matching data from disparate sources |
CN102214228B (zh) * | 2011-06-24 | 2013-03-13 | 国电南瑞科技股份有限公司 | 大电网分布式实时数据库系统的数据管理方法 |
US8965848B2 (en) * | 2011-08-24 | 2015-02-24 | International Business Machines Corporation | Entity resolution based on relationships to a common entity |
US8943059B2 (en) * | 2011-12-21 | 2015-01-27 | Sap Se | Systems and methods for merging source records in accordance with survivorship rules |
US8812542B1 (en) * | 2012-03-30 | 2014-08-19 | Emc Corporation | On-the-fly determining of alert relationships in a distributed system |
US20130339186A1 (en) * | 2012-06-15 | 2013-12-19 | Eventbrite, Inc. | Identifying Fraudulent Users Based on Relational Information |
US8935255B2 (en) | 2012-07-27 | 2015-01-13 | Facebook, Inc. | Social static ranking for search |
US9398104B2 (en) | 2012-12-20 | 2016-07-19 | Facebook, Inc. | Ranking test framework for search results on an online social network |
US9223826B2 (en) | 2013-02-25 | 2015-12-29 | Facebook, Inc. | Pushing suggested search queries to mobile devices |
US9910887B2 (en) | 2013-04-25 | 2018-03-06 | Facebook, Inc. | Variable search query vertical access |
US9330183B2 (en) | 2013-05-08 | 2016-05-03 | Facebook, Inc. | Approximate privacy indexing for search queries on online social networks |
US9223898B2 (en) | 2013-05-08 | 2015-12-29 | Facebook, Inc. | Filtering suggested structured queries on online social networks |
US9305322B2 (en) | 2013-07-23 | 2016-04-05 | Facebook, Inc. | Native application testing |
US9317614B2 (en) | 2013-07-30 | 2016-04-19 | Facebook, Inc. | Static rankings for search queries on online social networks |
US9514230B2 (en) | 2013-07-30 | 2016-12-06 | Facebook, Inc. | Rewriting search queries on online social networks |
US9460215B2 (en) | 2013-12-19 | 2016-10-04 | Facebook, Inc. | Ranking recommended search queries on online social networks |
US9336300B2 (en) | 2014-01-17 | 2016-05-10 | Facebook, Inc. | Client-side search templates for online social networks |
US9477760B2 (en) | 2014-02-12 | 2016-10-25 | Facebook, Inc. | Query construction on online social networks |
US9798832B1 (en) | 2014-03-31 | 2017-10-24 | Facebook, Inc. | Dynamic ranking of user cards |
US9794359B1 (en) | 2014-03-31 | 2017-10-17 | Facebook, Inc. | Implicit contacts in an online social network |
US20150278838A1 (en) * | 2014-04-01 | 2015-10-01 | TekWear, LLC | Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device |
US11169773B2 (en) | 2014-04-01 | 2021-11-09 | TekWear, LLC | Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device |
US9646055B2 (en) | 2014-04-03 | 2017-05-09 | Facebook, Inc. | Blending search results on online social networks |
US9679078B2 (en) | 2014-05-21 | 2017-06-13 | Facebook, Inc. | Search client context on online social networks |
US10268763B2 (en) | 2014-07-25 | 2019-04-23 | Facebook, Inc. | Ranking external content on online social networks |
US9871714B2 (en) | 2014-08-01 | 2018-01-16 | Facebook, Inc. | Identifying user biases for search results on online social networks |
US10255244B2 (en) | 2014-08-01 | 2019-04-09 | Facebook, Inc. | Search results based on user biases on online social networks |
US9792364B2 (en) | 2014-08-08 | 2017-10-17 | Facebook, Inc. | Blending search results on online social networks |
US10120909B2 (en) | 2014-08-22 | 2018-11-06 | Facebook, Inc. | Generating cards in response to user actions on online social networks |
US9703859B2 (en) | 2014-08-27 | 2017-07-11 | Facebook, Inc. | Keyword search queries on online social networks |
US9754037B2 (en) | 2014-08-27 | 2017-09-05 | Facebook, Inc. | Blending by query classification on online social networks |
US10255365B2 (en) | 2014-08-29 | 2019-04-09 | Facebook, Inc. | Priming search results on online social networks |
US10740412B2 (en) | 2014-09-05 | 2020-08-11 | Facebook, Inc. | Pivoting search results on online social networks |
US9507876B2 (en) | 2014-10-06 | 2016-11-29 | Facebook, Inc. | Constructing queries using query filters on online social networks |
US9703870B2 (en) | 2014-11-05 | 2017-07-11 | Facebook, Inc. | Social-based optimization of web crawling for online social networks |
US10409873B2 (en) | 2014-11-26 | 2019-09-10 | Facebook, Inc. | Searching for content by key-authors on online social networks |
US10552759B2 (en) | 2014-12-01 | 2020-02-04 | Facebook, Inc. | Iterative classifier training on online social networks |
US9679024B2 (en) | 2014-12-01 | 2017-06-13 | Facebook, Inc. | Social-based spelling correction for online social networks |
US9990441B2 (en) | 2014-12-05 | 2018-06-05 | Facebook, Inc. | Suggested keywords for searching content on online social networks |
US10102273B2 (en) | 2014-12-30 | 2018-10-16 | Facebook, Inc. | Suggested queries for locating posts on online social networks |
US10061856B2 (en) * | 2015-01-29 | 2018-08-28 | Facebook, Inc. | Multimedia search using reshare text on online social networks |
US20160224993A1 (en) * | 2015-02-03 | 2016-08-04 | Bank Of America Corporation | System for determining relationships between entities |
US10997257B2 (en) | 2015-02-06 | 2021-05-04 | Facebook, Inc. | Aggregating news events on online social networks |
US10049099B2 (en) | 2015-04-10 | 2018-08-14 | Facebook, Inc. | Spell correction with hidden markov models on online social networks |
US10095683B2 (en) | 2015-04-10 | 2018-10-09 | Facebook, Inc. | Contextual speller models on online social networks |
US10628636B2 (en) | 2015-04-24 | 2020-04-21 | Facebook, Inc. | Live-conversation modules on online social networks |
US10298535B2 (en) | 2015-05-19 | 2019-05-21 | Facebook, Inc. | Civic issues platforms on online social networks |
US10397167B2 (en) | 2015-06-19 | 2019-08-27 | Facebook, Inc. | Live social modules on online social networks |
US10509832B2 (en) | 2015-07-13 | 2019-12-17 | Facebook, Inc. | Generating snippet modules on online social networks |
US10268664B2 (en) | 2015-08-25 | 2019-04-23 | Facebook, Inc. | Embedding links in user-created content on online social networks |
US10810217B2 (en) | 2015-10-07 | 2020-10-20 | Facebook, Inc. | Optionalization and fuzzy search on online social networks |
US10795936B2 (en) | 2015-11-06 | 2020-10-06 | Facebook, Inc. | Suppressing entity suggestions on online social networks |
US10270868B2 (en) | 2015-11-06 | 2019-04-23 | Facebook, Inc. | Ranking of place-entities on online social networks |
US9602965B1 (en) | 2015-11-06 | 2017-03-21 | Facebook, Inc. | Location-based place determination using online social networks |
US10534814B2 (en) | 2015-11-11 | 2020-01-14 | Facebook, Inc. | Generating snippets on online social networks |
US10387511B2 (en) | 2015-11-25 | 2019-08-20 | Facebook, Inc. | Text-to-media indexes on online social networks |
CN106817390B (zh) | 2015-12-01 | 2020-04-24 | 阿里巴巴集团控股有限公司 | 一种用户数据共享的方法和设备 |
US10740368B2 (en) | 2015-12-29 | 2020-08-11 | Facebook, Inc. | Query-composition platforms on online social networks |
US10019466B2 (en) | 2016-01-11 | 2018-07-10 | Facebook, Inc. | Identification of low-quality place-entities on online social networks |
US10162899B2 (en) | 2016-01-15 | 2018-12-25 | Facebook, Inc. | Typeahead intent icons and snippets on online social networks |
US10262039B1 (en) | 2016-01-15 | 2019-04-16 | Facebook, Inc. | Proximity-based searching on online social networks |
US10740375B2 (en) | 2016-01-20 | 2020-08-11 | Facebook, Inc. | Generating answers to questions using information posted by users on online social networks |
US10157224B2 (en) | 2016-02-03 | 2018-12-18 | Facebook, Inc. | Quotations-modules on online social networks |
US10242074B2 (en) | 2016-02-03 | 2019-03-26 | Facebook, Inc. | Search-results interfaces for content-item-specific modules on online social networks |
US10216850B2 (en) | 2016-02-03 | 2019-02-26 | Facebook, Inc. | Sentiment-modules on online social networks |
US10270882B2 (en) | 2016-02-03 | 2019-04-23 | Facebook, Inc. | Mentions-modules on online social networks |
US10452671B2 (en) | 2016-04-26 | 2019-10-22 | Facebook, Inc. | Recommendations from comments on online social networks |
US10659299B1 (en) | 2016-06-30 | 2020-05-19 | Facebook, Inc. | Managing privacy settings for content on online social networks |
US10635661B2 (en) | 2016-07-11 | 2020-04-28 | Facebook, Inc. | Keyboard-based corrections for search queries on online social networks |
US10282483B2 (en) | 2016-08-04 | 2019-05-07 | Facebook, Inc. | Client-side caching of search keywords for online social networks |
US10223464B2 (en) | 2016-08-04 | 2019-03-05 | Facebook, Inc. | Suggesting filters for search on online social networks |
US10726022B2 (en) | 2016-08-26 | 2020-07-28 | Facebook, Inc. | Classifying search queries on online social networks |
US10534815B2 (en) | 2016-08-30 | 2020-01-14 | Facebook, Inc. | Customized keyword query suggestions on online social networks |
US10102255B2 (en) | 2016-09-08 | 2018-10-16 | Facebook, Inc. | Categorizing objects for queries on online social networks |
US10645142B2 (en) | 2016-09-20 | 2020-05-05 | Facebook, Inc. | Video keyframes display on online social networks |
US10026021B2 (en) | 2016-09-27 | 2018-07-17 | Facebook, Inc. | Training image-recognition systems using a joint embedding model on online social networks |
US10083379B2 (en) | 2016-09-27 | 2018-09-25 | Facebook, Inc. | Training image-recognition systems based on search queries on online social networks |
US10579688B2 (en) | 2016-10-05 | 2020-03-03 | Facebook, Inc. | Search ranking and recommendations for online social networks based on reconstructed embeddings |
US10311117B2 (en) | 2016-11-18 | 2019-06-04 | Facebook, Inc. | Entity linking to query terms on online social networks |
US10650009B2 (en) | 2016-11-22 | 2020-05-12 | Facebook, Inc. | Generating news headlines on online social networks |
US10235469B2 (en) | 2016-11-30 | 2019-03-19 | Facebook, Inc. | Searching for posts by related entities on online social networks |
US10185763B2 (en) | 2016-11-30 | 2019-01-22 | Facebook, Inc. | Syntactic models for parsing search queries on online social networks |
US10313456B2 (en) | 2016-11-30 | 2019-06-04 | Facebook, Inc. | Multi-stage filtering for recommended user connections on online social networks |
US10162886B2 (en) | 2016-11-30 | 2018-12-25 | Facebook, Inc. | Embedding-based parsing of search queries on online social networks |
US11223699B1 (en) | 2016-12-21 | 2022-01-11 | Facebook, Inc. | Multiple user recognition with voiceprints on online social networks |
US10607148B1 (en) | 2016-12-21 | 2020-03-31 | Facebook, Inc. | User identification with voiceprints on online social networks |
US10535106B2 (en) | 2016-12-28 | 2020-01-14 | Facebook, Inc. | Selecting user posts related to trending topics on online social networks |
US10489472B2 (en) | 2017-02-13 | 2019-11-26 | Facebook, Inc. | Context-based search suggestions on online social networks |
US10614141B2 (en) | 2017-03-15 | 2020-04-07 | Facebook, Inc. | Vital author snippets on online social networks |
US10769222B2 (en) | 2017-03-20 | 2020-09-08 | Facebook, Inc. | Search result ranking based on post classifiers on online social networks |
US11379861B2 (en) | 2017-05-16 | 2022-07-05 | Meta Platforms, Inc. | Classifying post types on online social networks |
US10248645B2 (en) | 2017-05-30 | 2019-04-02 | Facebook, Inc. | Measuring phrase association on online social networks |
US10268646B2 (en) | 2017-06-06 | 2019-04-23 | Facebook, Inc. | Tensor-based deep relevance model for search on online social networks |
US10489468B2 (en) | 2017-08-22 | 2019-11-26 | Facebook, Inc. | Similarity search using progressive inner products and bounds |
US10776437B2 (en) | 2017-09-12 | 2020-09-15 | Facebook, Inc. | Time-window counters for search results on online social networks |
US10678786B2 (en) | 2017-10-09 | 2020-06-09 | Facebook, Inc. | Translating search queries on online social networks |
US10810214B2 (en) | 2017-11-22 | 2020-10-20 | Facebook, Inc. | Determining related query terms through query-post associations on online social networks |
US10963514B2 (en) | 2017-11-30 | 2021-03-30 | Facebook, Inc. | Using related mentions to enhance link probability on online social networks |
US10129705B1 (en) | 2017-12-11 | 2018-11-13 | Facebook, Inc. | Location prediction using wireless signals on online social networks |
US11604968B2 (en) | 2017-12-11 | 2023-03-14 | Meta Platforms, Inc. | Prediction of next place visits on online social networks |
CN110019274B (zh) | 2017-12-29 | 2023-09-26 | 阿里巴巴集团控股有限公司 | 一种数据库系统以及查询数据库的方法和装置 |
CN108509182A (zh) * | 2018-02-27 | 2018-09-07 | 北京航空航天大学 | 将非结构化大数据进行结构化处理并融合的软件技术 |
CN109086574B (zh) * | 2018-08-16 | 2022-01-07 | 国家卫生健康委科学技术研究所 | 疾病相关蛋白数据库 |
CN111406252B (zh) * | 2019-11-06 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 基于纠错码的共享区块链数据存储的共识 |
CN114969041B (zh) * | 2022-05-27 | 2023-06-30 | 河北省科学技术情报研究院(河北省科技创新战略研究院) | 一种多源主附实体同一性甄别及数据自补的处理方法 |
Family Cites Families (111)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US599175A (en) * | 1898-02-15 | Washing-machine | ||
US579424A (en) * | 1897-03-23 | Edwakd c | ||
US1261167A (en) * | 1917-10-25 | 1918-04-02 | Robert C Russell | Index. |
US3659085A (en) * | 1970-04-30 | 1972-04-25 | Sierra Research Corp | Computer determining the location of objects in a coordinate system |
US4232313A (en) * | 1972-09-22 | 1980-11-04 | The United States Of America As Represented By The Secretary Of The Navy | Tactical nagivation and communication system |
US5010478A (en) * | 1986-04-11 | 1991-04-23 | Deran Roger L | Entity-attribute value database system with inverse attribute for selectively relating two different entities |
JPS63282838A (ja) | 1987-05-14 | 1988-11-18 | Fujitsu Ltd | 名寄せ処理方式 |
JPH0212563A (ja) | 1988-06-30 | 1990-01-17 | Nec Corp | 情報管理方式 |
US5345587A (en) * | 1988-09-14 | 1994-09-06 | Digital Equipment Corporation | Extensible entity management system including a dispatching kernel and modules which independently interpret and execute commands |
JPH0317792A (ja) | 1989-06-14 | 1991-01-25 | Mitsubishi Plastics Ind Ltd | カードの記録方法 |
JPH03177972A (ja) * | 1989-12-07 | 1991-08-01 | Nec Corp | データベースシステム |
US4981370A (en) * | 1990-01-29 | 1991-01-01 | Dziewit Halina S | Document authentication apparatus |
US5555409A (en) * | 1990-12-04 | 1996-09-10 | Applied Technical Sysytem, Inc. | Data management systems and methods including creation of composite views of data |
JPH04237373A (ja) * | 1991-01-22 | 1992-08-25 | Toshiba Corp | キーワード入力方式 |
US5560006A (en) * | 1991-05-15 | 1996-09-24 | Automated Technology Associates, Inc. | Entity-relation database |
US5229764A (en) * | 1991-06-20 | 1993-07-20 | Matchett Noel D | Continuous biometric authentication matrix |
JP2922347B2 (ja) * | 1991-11-07 | 1999-07-19 | 富士通株式会社 | 異種データベース間のデータ結合装置及びデータ結合方法 |
JPH05250416A (ja) * | 1992-03-06 | 1993-09-28 | Toshiba Eng Co Ltd | データベースの登録・検索装置 |
EP0581421B1 (en) * | 1992-07-20 | 2003-01-15 | Compaq Computer Corporation | Method and system for certificate based alias detection |
US5403639A (en) * | 1992-09-02 | 1995-04-04 | Storage Technology Corporation | File server having snapshot application data groups |
US5454101A (en) * | 1992-09-15 | 1995-09-26 | Universal Firmware Industries, Ltd. | Data storage system with set lists which contain elements associated with parents for defining a logical hierarchy and general record pointers identifying specific data sets |
US5742806A (en) * | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
US5764977A (en) * | 1994-03-30 | 1998-06-09 | Siemens Stromberg-Carlson | Distributed database architecture and distributed database management system for open network evolution |
US5848373A (en) * | 1994-06-24 | 1998-12-08 | Delorme Publishing Company | Computer aided map location system |
JPH0863382A (ja) * | 1994-08-19 | 1996-03-08 | Fujitsu Ltd | 分散システムにおけるデータ整合性確認方法及びデータ整合性確認装置 |
US5675785A (en) * | 1994-10-04 | 1997-10-07 | Hewlett-Packard Company | Data warehouse which is accessed by a user using a schema of virtual tables |
US5873093A (en) * | 1994-12-07 | 1999-02-16 | Next Software, Inc. | Method and apparatus for mapping objects to a data source |
US5799309A (en) * | 1994-12-29 | 1998-08-25 | International Business Machines Corporation | Generating an optimized set of relational queries fetching data in an object-relational database |
JPH08305662A (ja) * | 1995-05-02 | 1996-11-22 | Fujitsu Ltd | クライアント認証システムおよび方法 |
US5659731A (en) * | 1995-06-19 | 1997-08-19 | Dun & Bradstreet, Inc. | Method for rating a match for a given entity found in a list of entities |
US5758343A (en) * | 1995-12-08 | 1998-05-26 | Ncr Corporation | Apparatus and method for integrating multiple delegate directory service agents |
US6035300A (en) * | 1995-12-15 | 2000-03-07 | International Business Machines Corporation | Method and apparatus for generating a user interface from the entity/attribute/relationship model of a database |
US5991733A (en) * | 1996-03-22 | 1999-11-23 | Hartford Fire Insurance Company | Method and computerized system for managing insurance receivable accounts |
US5878416A (en) * | 1996-06-14 | 1999-03-02 | Electronic Data Systems Corporation | Automated system and method for matching an item of business property to a recipient |
US5778375A (en) * | 1996-06-27 | 1998-07-07 | Microsoft Corporation | Database normalizing system |
US6052693A (en) * | 1996-07-02 | 2000-04-18 | Harlequin Group Plc | System for assembling large databases through information extracted from text sources |
US5819263A (en) * | 1996-07-19 | 1998-10-06 | American Express Financial Corporation | Financial planning system incorporating relationship and group management |
US5781911A (en) * | 1996-09-10 | 1998-07-14 | D2K, Incorporated | Integrated system and method of data warehousing and delivery |
US5892828A (en) * | 1996-10-23 | 1999-04-06 | Novell, Inc. | User presence verification with single password across applications |
US6076167A (en) * | 1996-12-04 | 2000-06-13 | Dew Engineering And Development Limited | Method and system for improving security in network applications |
US5845285A (en) * | 1997-01-07 | 1998-12-01 | Klein; Laurence C. | Computer system and method of data analysis |
JP4268690B2 (ja) * | 1997-03-26 | 2009-05-27 | ソニー株式会社 | 認証システムおよび方法、並びに認証方法 |
JP4027455B2 (ja) * | 1997-03-31 | 2007-12-26 | 富士通株式会社 | データベース管理システム |
ES2192323T3 (es) * | 1997-04-16 | 2003-10-01 | British Telecomm | Generador de sumarios de datos. |
CA2329345A1 (en) * | 1997-04-22 | 1998-10-29 | Greg Hetherington | Method and apparatus for processing free-format data |
US5794246A (en) * | 1997-04-30 | 1998-08-11 | Informatica Corporation | Method for incremental aggregation of dynamically increasing database data sets |
US6032158A (en) * | 1997-05-02 | 2000-02-29 | Informatica Corporation | Apparatus and method for capturing and propagating changes from an operational database to data marts |
US5991765A (en) * | 1997-05-06 | 1999-11-23 | Birdstep Technology As | System and method for storing and manipulating data in an information handling system |
US6202151B1 (en) * | 1997-05-09 | 2001-03-13 | Gte Service Corporation | System and method for authenticating electronic transactions using biometric certificates |
US5991408A (en) * | 1997-05-16 | 1999-11-23 | Veridicom, Inc. | Identification and security using biometric measurements |
JP3547069B2 (ja) * | 1997-05-22 | 2004-07-28 | 日本電信電話株式会社 | 情報関連づけ装置およびその方法 |
US5991758A (en) * | 1997-06-06 | 1999-11-23 | Madison Information Technologies, Inc. | System and method for indexing information about entities from different information sources |
US6122757A (en) * | 1997-06-27 | 2000-09-19 | Agilent Technologies, Inc | Code generating system for improved pattern matching in a protocol analyzer |
US6092199A (en) * | 1997-07-07 | 2000-07-18 | International Business Machines Corporation | Dynamic creation of a user account in a client following authentication from a non-native server domain |
US6523041B1 (en) * | 1997-07-29 | 2003-02-18 | Acxiom Corporation | Data linking system and method using tokens |
US6073140A (en) * | 1997-07-29 | 2000-06-06 | Acxiom Corporation | Method and system for the creation, enhancement and update of remote data using persistent keys |
US5995973A (en) * | 1997-08-29 | 1999-11-30 | International Business Machines Corporation | Storing relationship tables identifying object relationships |
US6044378A (en) * | 1997-09-29 | 2000-03-28 | International Business Machines Corporation | Method and system for a federated digital library by managing links |
US6357004B1 (en) * | 1997-09-30 | 2002-03-12 | Intel Corporation | System and method for ensuring integrity throughout post-processing |
US6014670A (en) * | 1997-11-07 | 2000-01-11 | Informatica Corporation | Apparatus and method for performing data transformations in data warehousing |
US6339775B1 (en) * | 1997-11-07 | 2002-01-15 | Informatica Corporation | Apparatus and method for performing data transformations in data warehousing |
US6035306A (en) * | 1997-11-24 | 2000-03-07 | Terascape Software Inc. | Method for improving performance of large databases |
US6041410A (en) * | 1997-12-22 | 2000-03-21 | Trw Inc. | Personal identification fob |
US6263446B1 (en) * | 1997-12-23 | 2001-07-17 | Arcot Systems, Inc. | Method and apparatus for secure distribution of authentication credentials to roaming users |
JPH11184884A (ja) | 1997-12-24 | 1999-07-09 | Ntt Data Corp | 同一人判定システムおよび方法 |
US5933831A (en) * | 1998-01-09 | 1999-08-03 | Lsi Logic Corporation | Viewing entity relationship diagrams using hyperlinks |
US6418450B2 (en) * | 1998-01-26 | 2002-07-09 | International Business Machines Corporation | Data warehouse programs architecture |
US6845453B2 (en) * | 1998-02-13 | 2005-01-18 | Tecsec, Inc. | Multiple factor-based user identification and authentication |
US6049805A (en) * | 1998-02-24 | 2000-04-11 | Microsoft Corporation | Dynamic event mechanism for objects with associational relationships |
GB2336007B (en) * | 1998-04-01 | 2003-01-29 | Mitel Corp | Agent-based data mining and warehousing |
JP3437441B2 (ja) * | 1998-04-08 | 2003-08-18 | 日本電信電話株式会社 | 検索方法、検索装置、および検索プログラムを記録した記録媒体 |
US6167517A (en) * | 1998-04-09 | 2000-12-26 | Oracle Corporation | Trusted biometric client authentication |
US6160903A (en) * | 1998-04-24 | 2000-12-12 | Dew Engineering And Development Limited | Method of providing secure user access |
US6684334B1 (en) * | 1998-05-27 | 2004-01-27 | Trusted Security Solutions, Inc. | Secure establishment of cryptographic keys using persistent key component |
US6208990B1 (en) * | 1998-07-15 | 2001-03-27 | Informatica Corporation | Method and architecture for automated optimization of ETL throughput in data warehousing applications |
US6185557B1 (en) * | 1998-07-31 | 2001-02-06 | Unisys Corporation | Merge join process |
US6743022B1 (en) * | 1998-12-03 | 2004-06-01 | Oded Sarel | System and method for automated self measurement of alertness equilibrium and coordination and for ventification of the identify of the person performing tasks |
US6931392B1 (en) * | 1998-12-07 | 2005-08-16 | Vitria Technology, Inc. | Real-time decision support system |
US6317834B1 (en) * | 1999-01-29 | 2001-11-13 | International Business Machines Corporation | Biometric authentication system with encrypted models |
US6819797B1 (en) * | 1999-01-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for classifying and querying temporal and spatial information in video |
AU2523300A (en) | 1999-04-07 | 2000-10-12 | Reclaim Technologies And Sservices, Ltd. | A system for identification of selectively related database records |
US20020038308A1 (en) * | 1999-05-27 | 2002-03-28 | Michael Cappi | System and method for creating a virtual data warehouse |
US6697947B1 (en) * | 1999-06-17 | 2004-02-24 | International Business Machines Corporation | Biometric based multi-party authentication |
US6385604B1 (en) * | 1999-08-04 | 2002-05-07 | Hyperroll, Israel Limited | Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements |
JP2001118103A (ja) * | 1999-10-15 | 2001-04-27 | Oki Electric Ind Co Ltd | ゲート管理装置 |
ATE410754T1 (de) * | 1999-10-19 | 2008-10-15 | Stamps Com | System und verfahren zum adressvergleich |
JP2001117940A (ja) | 1999-10-20 | 2001-04-27 | Just Syst Corp | 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7003560B1 (en) * | 1999-11-03 | 2006-02-21 | Accenture Llp | Data warehouse computing system |
NZ543166A (en) * | 2000-04-07 | 2006-12-22 | Procter & Gamble | Monitoring the effective velocity of items through a store or warehouse for predicting stock levels |
JP2001325425A (ja) | 2000-05-15 | 2001-11-22 | Fujitsu Ltd | 名寄せ処理システム |
GB2366160B (en) * | 2000-08-09 | 2004-03-17 | Michaelhouse Man Ltd | Information routing |
US7302582B2 (en) * | 2000-08-21 | 2007-11-27 | United States Postal Service | Delivery point validation system |
US6675476B2 (en) * | 2000-12-05 | 2004-01-13 | Hewlett-Packard Development Company, L.P. | Slotted substrates and techniques for forming same |
US6954757B2 (en) * | 2001-02-02 | 2005-10-11 | Hewlett-Packard Development Company, L.P. | Framework, architecture, method and system for reducing latency of business operations of an enterprise |
US6886747B2 (en) * | 2001-03-22 | 2005-05-03 | United States Postal Service | System and method for standardizing a mailing address |
US7856420B2 (en) * | 2001-04-19 | 2010-12-21 | Hewlett-Packard Development Company, L.P. | Zero latency enterprise enriched publish/subscribe |
US7092951B1 (en) * | 2001-07-06 | 2006-08-15 | Ncr Corporation | Auxiliary relation for materialized view |
US20030030733A1 (en) * | 2001-08-08 | 2003-02-13 | Seaman Mark D. | System and method for synchronization of media data |
US6912549B2 (en) * | 2001-09-05 | 2005-06-28 | Siemens Medical Solutions Health Services Corporation | System for processing and consolidating records |
US7370044B2 (en) * | 2001-11-19 | 2008-05-06 | Equifax, Inc. | System and method for managing and updating information relating to economic entities |
KR100850255B1 (ko) * | 2001-12-28 | 2008-08-19 | 인터내셔널 비지네스 머신즈 코포레이션 | 실시간 데이터 웨어하우징 |
US7590544B2 (en) * | 2002-03-06 | 2009-09-15 | United States Postal Service | Method for correcting a mailing address |
AU2003213722A1 (en) * | 2002-03-21 | 2003-10-08 | David J. Payne | Method and system for storing and retrieving data using hash-accessed multiple data stores |
US7096213B2 (en) * | 2002-04-08 | 2006-08-22 | Oracle International Corporation | Persistent key-value repository with a pluggable architecture to abstract physical storage |
US6968338B1 (en) | 2002-08-29 | 2005-11-22 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Extensible database framework for management of unstructured and semi-structured documents |
US7159119B2 (en) * | 2002-09-06 | 2007-01-02 | United States Postal Service | Method and system for efficiently retrieving secured data by securely pre-processing provided access information |
US7900052B2 (en) * | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
US20040099313A1 (en) * | 2002-11-26 | 2004-05-27 | Gotthelf Jeffrey Bryan | Fluid flow pressure regulator |
WO2004061668A1 (en) * | 2002-12-31 | 2004-07-22 | International Business Machines Corporation | Authorized anonymous authentication |
US7200602B2 (en) * | 2003-02-07 | 2007-04-03 | International Business Machines Corporation | Data set comparison and net change processing |
WO2004097596A2 (en) | 2003-03-24 | 2004-11-11 | Systems Research & Development | Secure coordinate identification method, system and program |
-
2002
- 2002-12-27 KR KR1020047010275A patent/KR100850255B1/ko not_active IP Right Cessation
- 2002-12-27 EA EA200400873A patent/EA200400873A1/ru unknown
- 2002-12-27 CN CNA200810137940XA patent/CN101324902A/zh active Pending
- 2002-12-27 JP JP2003558673A patent/JP2006501529A/ja active Pending
- 2002-12-27 MX MXPA04006390A patent/MXPA04006390A/es unknown
- 2002-12-27 PL PL02374305A patent/PL374305A1/xx unknown
- 2002-12-27 KR KR1020077024459A patent/KR100877461B1/ko not_active IP Right Cessation
- 2002-12-27 CN CNB028283759A patent/CN100483333C/zh not_active Expired - Lifetime
- 2002-12-27 IL IL16274602A patent/IL162746A0/xx unknown
- 2002-12-27 BR BR0215411-0A patent/BR0215411A/pt not_active Application Discontinuation
- 2002-12-27 KR KR1020077024457A patent/KR100856771B1/ko not_active IP Right Cessation
- 2002-12-27 CA CA2471940A patent/CA2471940C/en not_active Expired - Lifetime
- 2002-12-27 EP EP02806260A patent/EP1470475A4/en not_active Withdrawn
- 2002-12-27 US US10/331,068 patent/US8452787B2/en active Active
- 2002-12-27 WO PCT/US2002/041630 patent/WO2003058427A1/en active Application Filing
- 2002-12-27 AU AU2002367376A patent/AU2002367376A1/en not_active Abandoned
-
2004
- 2004-06-28 ZA ZA200405141A patent/ZA200405141B/xx unknown
-
2005
- 2005-09-08 US US11/221,622 patent/US8615521B2/en active Active
-
2008
- 2008-09-16 JP JP2008237101A patent/JP4456646B2/ja not_active Expired - Lifetime
- 2008-09-16 JP JP2008237042A patent/JP4366433B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU2002367376A1 (en) | 2003-07-24 |
US8452787B2 (en) | 2013-05-28 |
KR20070112423A (ko) | 2007-11-23 |
KR20070112422A (ko) | 2007-11-23 |
JP4456646B2 (ja) | 2010-04-28 |
EA200400873A1 (ru) | 2005-12-29 |
KR100856771B1 (ko) | 2008-09-05 |
KR100850255B1 (ko) | 2008-08-19 |
PL374305A1 (en) | 2005-10-03 |
EP1470475A4 (en) | 2009-04-22 |
IL162746A0 (en) | 2005-11-20 |
JP2009059372A (ja) | 2009-03-19 |
BR0215411A (pt) | 2005-09-06 |
CA2471940C (en) | 2019-03-05 |
CN1656442A (zh) | 2005-08-17 |
KR100877461B1 (ko) | 2009-01-07 |
CN101324902A (zh) | 2008-12-17 |
EP1470475A1 (en) | 2004-10-27 |
US8615521B2 (en) | 2013-12-24 |
US20060010119A1 (en) | 2006-01-12 |
JP2006501529A (ja) | 2006-01-12 |
WO2003058427A8 (en) | 2005-06-02 |
JP4366433B2 (ja) | 2009-11-18 |
WO2003058427A1 (en) | 2003-07-17 |
CN100483333C (zh) | 2009-04-29 |
JP2009059371A (ja) | 2009-03-19 |
KR20040088036A (ko) | 2004-10-15 |
CA2471940A1 (en) | 2003-07-17 |
ZA200405141B (en) | 2005-11-21 |
US20030154194A1 (en) | 2003-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MXPA04006390A (es) | Creacion de depositos de datos en tiempo real. | |
US8620937B2 (en) | Real time data warehousing | |
US10025904B2 (en) | Systems and methods for managing a master patient index including duplicate record detection | |
Gu et al. | Record linkage: Current practice and future directions | |
US8768914B2 (en) | System and method for searching and matching databases | |
AU2008339587B2 (en) | Data normalisation for investigative data mining | |
JP5193061B2 (ja) | 顧客駆動型クエリからの照合を強化するための方法およびシステム | |
CN114090076A (zh) | 应用程序的合规性判别方法和装置 | |
CN110781213B (zh) | 一种以人员为中心的多源海量数据关联搜索方法和系统 | |
JPH06274550A (ja) | 名刺管理システム | |
CN113204644B (zh) | 一种基于知识图谱的政务百科构建方法 |