MXPA06004481A - Estructura de datos y sistema de administracion para un super conjunto de bases de datos relacionales. - Google Patents

Estructura de datos y sistema de administracion para un super conjunto de bases de datos relacionales.

Info

Publication number
MXPA06004481A
MXPA06004481A MXPA06004481A MXPA06004481A MXPA06004481A MX PA06004481 A MXPA06004481 A MX PA06004481A MX PA06004481 A MXPA06004481 A MX PA06004481A MX PA06004481 A MXPA06004481 A MX PA06004481A MX PA06004481 A MXPA06004481 A MX PA06004481A
Authority
MX
Mexico
Prior art keywords
data
preferred
artifacts
alias
database
Prior art date
Application number
MXPA06004481A
Other languages
English (en)
Inventor
Bruce E Harrison
Original Assignee
United Parcel Service Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Parcel Service Inc filed Critical United Parcel Service Inc
Publication of MXPA06004481A publication Critical patent/MXPA06004481A/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Se describe una estructura de datos, sistema de manejo de base de datos, y metodos para validar datos; se describe una estructura de datos la cual incluye un superconjunto de base de datos por relacion interconectadas que contienen multiples cuadros que tienen una estructura de datos comunes; los cuadros pueden almacenarse como una lista enlazada de matriz dispersa; se describe un metodo para ordenar registros en orden jerarquico, en una serie de niveles desde los generales a los especificos; se describe un ejemplo de uso con bases de datos de direcciones, incluyendo un metodo para convertir una direccion de entrada que tiene una representacion tematica en una direccion de salida que tiene una representacion preferida; los artefactos preferidos pueden marcarse con un articulo fisico; los cuadros de nombres supuestos tambien pueden incluirse.

Description

ESTRUCTURA DE DATOS Y SISTEMA DE ADMINISTRACION PARA UN SUPER CONJU TO DE BASES DE DATOS RELACIONALES CAMPO DE LA INVENCION La siguiente descripción se refiere en general a sistemas de administración de bases de datos relaciónales y más particularmente, a un método y aparato para procesar datos jerárquicos a través de múltiples bases relaciónales utilizando listas enlazadas a la matriz escasa en un entorno de de red de computadora.
ANTECEDENTES DE LA INVENCION La base de datos ha sido un producto básico de la computación desde el inicio de la era digital. Una base de datos se refiere generalmente a uno o más grupos datos persistentes estructurados, grandes, usualmente asociados con un sistema de software para crear, actualizar, y consultar los datos. En una base de datos, cada valor de los datos se almacena en un campo; un grupo de campos juntos forman un registro; y un grupo de registros se pueden almacenar juntos en un archivo. Las primeras bases de datos eran planas; significando que todos los datos se almacenaban en una sola línea llamado archivo delimitado. En un archivo delimitado, cada campo está separado por un carácter especial tal como una coma. Cada registro se separa a través de un carácter diferente, tal como un acento circunflejo (?) un carácter tabular. Un simple archivo delimitado puede verse así: Ultimo, Primero, Edad ADoe, John, 26 ASmith, Jane, 43 AJones, David, 34 A cada campo se puede asignar un hombre categoría llamado un atributo. En el archivo demuestra anterior, los atributos son Último, Primero, y Edad. El atributo indica el tipo de datos que se va a almacenar en cada campo. Para grandes cantidades de datos, el archivo de texto delimitado puede crecer mucho. El acceso a datos específicos generalmente requiere de una búsqueda secuencial a través de la lista completa. Según la capacidad de las computadoras y las bases de datos se incrementa, la necesidad de acceso más eficiente y técnicas de búsqueda más rápidas conducen al desarrollo de nuevas estructuras de datos. El modelo de base de datos relaciónales se describió al principio de los setentas. En una base de de datos relacional, los datos se almacenan en un cuadro. Un cuadro organiza los datos en filas y columnas, proveyendo un lugar específico (tal como una fila x, columna y) para cada campo. Cada axila contiene un solo registro. Las columnas se organizan en orden, a través del atributo, por lo que todos los campos en cada columna contienen el mismo tipo de datos. El archivo delimitado anterior se puede determinar en el formato de cuadro como éste: Ultimo Primero Edad Doe Smith 26 Smith Jane 43 Jones David 34 El grupo de atributos o encabezados de columna algunas veces son referidos como el esquema de un cuadro. El cuadro anterior, por ejemplo, puede ser descrito como un cuadro que tiene el esquema (Último, Primero, Edad). El formato de cuadro para un archivo de bases de datos hace la búsqueda y el acceso a los datos más rápido y más eficiente. Los registros (filas) también se pueden almacenar en un nuevo orden, con base en una o más de las columnas (campos). Por lo general se utiliza la clasificación para ordenar los registros de tal forma que el dato más deseado aparece primero en el archivo, por lo tanto haciendo la búsqueda más rápida. Ya que la velocidad y capacidad de la computación se incrementan, los cuadros de bases de datos son capaces de almacenar más grandes cantidades de datos. Los registros adicionales (filas) se pueden agregar para describir instancias adicionales. Los atributos adicionales (columna) se pueden agregar para acomodar más tipos de datos acerca de cada instancia. Mientras el número de campos se incrementa, la tarea de cambiar estructura del cuadro (agregar o eliminar filas y columnas) se hace más compleja e incrementa la probabilidad de error. También, para grandes cuadros, la tarea de clasificar los datos con base en una o más columnas se hace más compleja y consumidora de tiempo. Al agregar diversos tipos de datos en un solo cuadro bidimensional, grande eventualmente crea problemas tales como redundancia, inconsistencia, requerimientos de almacenamiento aumentados, y velocidades de clasificación y computación más lentas.
Bases de datos relaciónales con múltiples cuadros Para acomodar diversos tipos de campos conteniendo datos relacionados, un modelo de base de datos relacional puede incluir múltiples cuadros. Los cuadros múltiples conteniendo los datos relacionados pueden enlazarse juntos utilizando un campo clave. Un campo clave contiene un identificador único para cada registro (una fila de datos). El campo clave puede contener datos actuales, tal como un número de parte o un Número de Seguro Social, mientras sea único para ese registro. Esto algunas veces se denomina una clave lógica. El campo clave también puede ser una clave sustituía, tal como número de registro, que es un identificador único no relacionado con los datos actuales. También, una clave se puede definir utilizando un solo campo o un grupo de campos. Una clave simple se basa en un campo simple, mientras una clave compuesta se basa en múltiples campos. En una base de datos relacional, los datos relacionados se pueden almacenar en múltiples cuadros. Un campo clave llamado un "campo primario" actúa como un punto de referencia único para encontrar un registro particular en un cuadro. Por ejemplo, los atributos (o encabezados de columna) en un "Cuadro A" de muestra puede ser (Nombre, Edad, Número de Seguro Social, Número de Empleado). La clave primaria para el Cuadro A es el campo de Número de Seguro Social. En las bases de datos relaciónales en donde los datos almacenan en múltiples cuadros, otro campo clave denominado una "clave forense" se utiliza como un punto de referencia para conectar los cuadros. Por ejemplo, considerar otro cuadro de ejemplo: "Cuadro B" que tiene el esquema (Número de Empleado, Nombre de Departamento, Fecha de Contratación, Salario). La clave primaria para el Cuadro B es el campo Número de Empleado único. Haciendo referencia de nuevo los atributos en el Cuadro A, la clave forense para el Cuadro A es el campo de Número de Empleado, porque enlazar los registros en el Cuadro A con los registros en el Cuadro B. esta relación entre los cuadros se puede utilizar utilizando Diagramas de Relación de Entidad, en donde cada cuadro contienen los datos para una iniquidad o categoría única, tales como "Edad" o "Departamento".
Base de Datos Relacional El campo "NrEmpleado" sombreado es común en ambos cuadros, y provee un enlace entre los datos en los dos Cuadros. El campo "NrEmpleado" es la clave forense en el Cuadro A, pero es la clave primaria en el Cuadro B. El Cuadro A y el Cuadro B no incluyen el mismo número de registros. Por ejemplo, los registros en el Cuadro A pueden incluir los nombres, edades, Números de Seguro Social, y Números de Empleado de todos en una organización; y los registros en el Cuadro B pueden estar limitados a solamente a aquellos en un departamento o división particular. Al incluirse grupos de datos distintos en cuadros separados, la base de datos relacional puede acceder cuadro seleccionados para una variedad de propósitos. Una base de datos relacional individual puede incluir cualquier número de cuadros, de solamente unos cuantas a varios miles de cuadros. El lenguaje de consulta permite los usuarios interactuar con una base de datos y analizar los datos los cuadros. Una consulta es una colección de instrucciones utilizadas para extraer un grupo de datos de una base de datos. Las consultas no cambian la información en los cuadros; simplemente desplegar información al usuario. El resultado de una consulta algunas veces se llamaba una vista. El lenguaje de consulta mejor conocido es el Lenguaje de Consulta Estructurado (SQL) pronunciado "esecuele". SQL ese lenguaje estándar para la interoperabilidad de la base de datos. Las consultas probablemente son el aspecto más frecuentemente utilizado de SQL, pero los comandos de SQL también se pueden utilizar como una herramienta de programación, para crear y mantener una base de datos.
Sistemas de Administración de Base de Datos Un sistema de administración de base de datos (algunas veces abreviado como DBMS) se refieren en general a una interfaz y uno o más programas de software de computadora específicamente diseñados para manejar y manipular la información en una base de datos. El DBMS puede incluir un paquete complejo de programas de software para controlar la organización, almacenamiento recuperación de los datos, así como la seguridad e integridad de la base de datos. El DBMS también puede incluir una interfaz, para aceptar solicitudes para datos de aplicaciones externas. Una interfaz es un programa de computadora diseñado para proveer una conexión o interfaz operativa entre un usuario y una aplicación, tal como un DBMS. Una interfaz para un DBMS puede proveer una serie de comandos que permiten a un usuario crear, leer, actualizar, y eliminar los valores de los datos almacenados en los cuadros de la base de datos. Estas funciones (crear, leer, actualizar, eliminar) algunas veces son referidas utilizando en la camino CRUD, por lo que una interfaz con esos comandos puede ser denominada una interfaz CRUD. Una interfaz de base de datos que incluye una función de consulta puede ser denominada una interfaz CRUDO. Una interfaz basada en COM se refiere a un software está basado en el Modelo del Objeto del Componente. El Modelo del Objeto de Componente es una arquitectura de software abierta desarrollada por Digital Equipment Corporation and Microsoft que permiten la interoperabilidad entre varios componentes de un sistema de base de datos. En una base de datos relacional que incluye múltiples cuadros, el sistema de administración de la base de datos (DBMS) generalmente es responsable de mantener todos los enlaces entre y en medio de todos los campos clave en los varios cuadros. Esto se refiere como manteniendo la "integridad referencial" de la base de datos. El mantener la integridad referencial polo general es un reto en una base de datos relacional que incluye un gran número de cuadros. La naturaleza enlazada de los cuadros de la base de datos tiene muchas ventajas, pero también permite que un error se propague a través de los cuadros y a lo largo de las bases de datos completas, especialmente cuando los registros o los campos clave se modifican o eliminan. El potencial de error está compuesto de sistemas en donde una variedad de usuarios tienen acceso a la base de datos a través de una interfaz CRUD. En un entorno de red de computadora, una gran base de datos puede estar alojada en un servidor central, con muchos usuarios o suscriptores accediendo los datos desde ubicaciones remotas utilizando un enlace de comunicación. La velocidad del acceso polo general está limitada por el tipo y capacidad del enlace de comunicación. La distribución de un duplicado de la base datos completa a una ubicación remota generalmente es impráctica, especialmente para aplicaciones en donde los datos deben ser actuales para ser útiles. También, una gran base de datos almacenada localmente podría crear una carga substancial a los usuarios locales debido a que los sistemas remotos típicamente son más pequeños que los servidores centrales. El almacenamiento de una base de datos grande en un sistema local sin capacidad suficiente polo general origina un incremento no aceptable en tiempo de computación. El costo de actualizar todo el hardware para cada ubicación remota puede ser demasiado costoso, especialmente para redes usuario muy grandes. La actualización de los datos en las grandes bases de datos relaciónales puede ser técnicamente un reto y consumidora de tiempo, especialmente en un entorno en red en donde los datos deben actualizarse frecuentemente. La transmisión de una copia actualizada de la base de datos completa polo general es impráctico y prohibitivo en cuanto a costo. También, el costo y el retraso distribución pueden presentar una barrera a la frecuencia de las actualizaciones. De esta forma, existe una necesidad de la técnica de un sistema de administración de base de datos mejorado capaz de mantener y proteger un gran volumen de datos, distribuir actualizaciones frecuentes en una forma efectiva en cuanto costo, y procesar solicitudes para datos rápida y eficientemente en todas las ubicaciones dentro de una red.
Bases de datos de direcciones Estados Unidos incluye más de 145 millones de direcciones distribuibles. Una base de datos que contiene información acerca de todas ésas direcciones de calles es un ejemplo de una base de datos muy grande. Las bases de datos de direcciones están disponibles de fuentes privadas o de fuentes del gobierno, tal como el Servicio Postal de E.U.A. (USPS). El USPS ofrece una variedad de bases de datos de direcciones al público, incluyendo el archivo de Ciudad-Estado, un archivo CP de Cinco-Dígitos, y un archivo de CP+4. El archivo de Ciudad-Estado es una lista comprensible los códigos postales con hombres de ciudad de y municipio correspondientes. El archivo de CP de Cinco-Dígitos, cuando se utiliza en conjunción con el archivo Ciudad-Estado, permite a los usuarios validar las asignaciones de CP. de cinco dígitos existentes. El archivo de CP. + 4 provee una lista comprensible de los códigos postales + 4. El Archivo de Secuencia de Distribución (DSF) es una base de datos computarizado desarrollada por el USPS que incluye un registro completo de las direcciones estandarizadas, almacenadas en un registro distinto, para cada punto de distribución del servicio través de USPS. Cada registro separado contiene la dirección de la calle, el CP. + 4, el código de la ruta del portador, el número de secuencia distribución (número de secuencia de camino), un código del tipo de distribución, y un indicador de distribución por estación. DSF incluye suficientes datos para lograr la validación y estandarización de la dirección. DSF se ofrece a titulares que desarrollan 1 software de higiene de dirección certificada. El USPS recientemente desarrolló una nueva base de datos Validación del Punto de Distribución (DPV) para reemplazar DSF. La base de datos DPV está disponible en su formato básico con su formato mejorado, llamados DSF2, el cual incluye atributos de dirección adicionales.
Estandarización de dirección La necesidad estandarizar las direcciones de correo es un desarrollo relativamente moderno. Un tremendo incremento en el volumen de correo, en su mayor parte correo de negocios, originó crisis seria para el servicio postal al inicio de los sesentas. La computadora fue la única gran fuerza detrás del incremento dramático en el volumen del correo. La computadora le permitió los negocios automatizar una variedad de funciones de correo, el servicio postal no estaba preparado para la explosión en el volumen de correo. En respuesta a la crisis, se instituyó el Plan de Mejoramiento por Zonas (ZIP). En julio de 1963, se había asignado un CP. de cinco dígitos a cada dirección distribuible en Estados Unidos. El CP. marcó el inicio de de la era moderna del estandarización de direcciones. Dos décadas después, se introdujo el CP. +4, agregando un guión y 4 + dígitos al CP. Hoy en día, el correo por lo general se clasifica utilizando lectores de caracteres ópticos multilínea que exploran la dirección completa, imprimen un Código de Barras de Punto de Distribución de 11 dígitos (DPBC) en el sobre, y clasifica en el correo en charolas en la secuencia de camino establecida a lo largo de cada ruta de distribución. La estandarización de las direcciones transforma una dirección dada en el mejor formato para reunir las guías gubernamentales, tales como aquéllas establecidas por el USPS. La estandarización afecta todos los componentes de la dirección de distribución, incluyendo el formato, fuente, espaciado, tipografía, puntuación, y CP. o DPBC. Por ejemplo, una dirección o estándar tal como: John Doe 123 East Main Street, N. W. Oakland Center, Suite A-4 Atlanta, Georgia 30030 puede verse un poco diferente después de la estandarización: JOHN DOE 123 E MAIN ST NW STE A4 DECATUR GA 30030-1549 ?p?, ? p,??,p,, ??,??,,?p ? ?,?,? p??? ?, ? ? ? ?,?p??,???,? Una dirección se puede subdividir o descomponer en sus componentes, los cuales algunas veces se denominan artefactos. Por ejemplo, los artefactos individuales en la dirección anterior incluyen un Residente o Destinatario (John Doe), un Número (123), un Pre-Direccional (E), un Nombre Principal (Main), un Tipo (St), un Post-Direccional (NW), un Nombre Secundario (STE), un Número Secundario (A4), y una ciudad, estado, y C.P.+4 (Decatur GA 30030-1549). El dividir una dirección en sus artefactos individuales es útil en muchos contextos, incluyendo la clasificación postal y la validación de la dirección.
Validación de la dirección Mientras la estandarización se refiere a la forma en la que una dirección se formatea, el proceso de validación de dirección confirma si una dirección dada es válida y actual. Las bases de datos de direcciones, de fuentes privadas o gubernamentales, polo genas utilizan para validar direcciones. Por ejemplo, la base datos de USPS explicada anteriormente puede ser útil para los propósitos de comparación para validar direcciones. Además de los servicios postales gubernamentales, los servicios privados tales como los portadores de paquetes comerciales por lo general desarrollan y mantienen la base de datos de direcciones para clasificar la información del cliente única y valiosa. Las bases de datos privadas, desarrolladas independientemente de los datos del servicio postal gubernamental, pueden representar la siguiente generación en la precisión de las direcciones y el almacenamiento de los datos. En el futuro, estarán disponibles una más amplia variedad de bases de datos de direcciones gubernamentales y privadas. La base datos de direcciones de USPS se actualiza regularmente con nuevos datos. Además de las actualizaciones periódicas, regulares, el USPS también ha desarrollado un número de bases de datos de corrección incluyendo NCOA y LACS. La base de datos Cambio Nacional de Dirección (NCOA) contiene registros de cambio de dirección. El Sistema de Conversión de Direcciones Localizables (LACS) contiene normas direcciones para regiones que han experimentado una conversión de ruta rural a direcciones de tipo ciudad. Debido al crecimiento en los cambios y los cambios en la población, las bases de datos de direcciones generalmente requieren de una actualización frecuente. Como con otras grandes bases de datos, la actualización de datos en bases de datos de direcciones muy grandes esto lo general técnicamente un reto y consumidora de tiempo. De esta forma, en el contexto de las bases de datos de direcciones, existe una necesidad a la técnica de un sistema para administrar la base de datos mejorado capaz de mantener y proteger grandes cantidades de datos de direcciones, distribución frecuente de actualizaciones a los usuarios o suscriptores en una forma efectiva en cuanto costo, y el procesamiento de la solicitudes para direcciones rápida y eficientemente.
BREVE DESCRIPCION DE LA INVENCION La siguiente breve descripción no es un esquema general extensivo y no pretende identificar los elementos clave o críticos de los aparatos, métodos, sistemas, procedimientos y similares, o delinear el alcance de dichos elementos. Esta breve descripción provee una introducción conceptual en una forma simplificada de la descripción más detallada que sigue. Ciertos aparatos, métodos, sistemas, procedimientos y similares de ejemplos ilustrativos, se describen aquí en conexión con la descripción siguiente y las Figuras adjuntas. Estos ejemplos representan solamente unas cuantas de las varias formas en las cuales los principios soportan los aparatos, métodos, sistemas, procedimientos y similares, que se pueden emplearse y en esta forma pretenden incluir equivalentes. Otras ventajas y características novedosas se pueden hacer evidentes a partir de la descripción detallada que sigue, cuando se conocerán junto con los dibujos de las Figuras anexas. En vista de las amplias enseñanzas de la presente invención, se provee una estructura de datos, un sistema para la administración de la base de datos, un aparato de procesamiento, y métodos relacionados que tienen una construcción ventajosa. Los aparatos, métodos y sistemas de ejemplos descritos aquí facilitan la rápida y eficiente validación de los datos capturados presentados en una representación subjetiva y produce datos de salida que tienen una representación preferida. En un aspecto de la presente invención, una estructura de datos puede incluir un supergrupo que incluye la base de datos primaria operativamente conectada a una o más bases de datos secundarios, en donde cada una de la primaria y una o más bases datos secundarias comprenden un primer cuadro operativamente enlazado a uno o más de otros cuadros, y cada uno del primero y uno o más que otros cuadros comparten una estructura de datos común. Las bases de datos pueden ser bases de datos relaciónales, la estructura de datos común puede incluir una lista enlazada a una matriz escasa. La estructura de datos común también puede incluir registros de datos organizados en un orden jerárquico, en una serie de niveles a partir de general a específico, con base en los datos. En la estructura de datos, la base datos primaria puede incluir cuadros fuente, una primera base de datos secundarias puede incluir cuadros alias y una segunda base de datos secundarias puede incluir cuadros estandarización, y una tercera base de datos secundarias puede estar configurado para aceptar y almacenar datos de captura. Los cuadros fuente pueden incluir registros de datos obtenidos de una fuente pública o privada, los cuadros alias pueden incluir una o más representaciones equivalentes de un registro, y los cuadros estandarización pueden incluir una o más representaciones estandarizadas de un registro. En otro aspecto de la estructura de datos, los cuadros fuente pueden incluir registros de direcciones obtenidos de un servicio postal gubernamental o de una fuente comercial. Dentro de la estructura de datos, el primer cuadro puede incluir registros preferidos, un primer cuadro diferente puede incluir registros alias primarios, y un segundo cuadro diferente puede incluir registros alias secundarios. Los registros preferidos pueden incluir una o más representaciones preferidas, los registros alias primarios pueden incluir una o más representaciones equivalentes de un artefacto primario, y los registros alias secundarios pueden incluir una o más representaciones equivalentes de un artefacto secundario. En un aspecto relacionado, los registros preferidos pueden incluir una o más representaciones preferidas de una dirección. En otro aspecto de la presente invención, se provee un método para preparar los datos para una búsqueda óptima, los datos estando almacenados en una o más bases de datos que comprenden una pluralidad de cuadros enlazados a registros. El método puede incluir organizar los registros en cada uno de los cuadros en un orden jerárquico, en una serie de niveles de general a específico, con base en los datos; y transformar cada uno de los cuadros en uno o más cuadros de lista enlazados a través de una matriz escasa. Cuando las bases de datos existen en un entorno de red servidor-cliente, el método también puede incluir la distribución de un duplicado de uno o más cuadros de lista enlazados a una matriz escasa de un servidor a uno o más clientes. Las bases de datos pueden ser bases de datos relaciónales interconectadas para formar un supergrupo de datos. En un aspecto como los datos pueden incluir artefactos de direcciones. En otro aspecto de la presente invención, se provee un aparato para preparar los datos para una búsqueda óptima, los datos siendo almacenados en una o más bases de datos que comprenden una pluralidad de cuadros de registros enlazados. El aparato puede incluir una unidad de procesamiento central, una memoria, un sistema de entrada/salida básico, y un almacenamiento de programa conteniendo un módulo de programa ejecutable a través de la unidad de procesamiento central. El módulo de programa puede incluir medios para organizar los registros en cada uno de los cuadros en un orden jerárquico, en una serie de niveles de general a específico, con base en los datos; y medios para transformar cada uno de los cuadros en cuadros de lista enlazados a una matriz escasa. El aparato también puede incluir uno o más clientes remotos a partir de la unidad de procesamiento central. El módulo de programa también puede incluir medios para distribuir un duplicado de uno o más cuadros de lista enlazados de matriz escasa de un servidor a uno o más clientes. En otro aspecto de la presente invención, se provee un método para utilizar una base de datos de cuadros enlazados para convertir una representación subjetiva en una representación preferida. El método puede incluir captura ia representación subjetiva y almacenarla en el primero de los cuadros enlazados; almacenar los datos fuente en un segundo cuadro enlazado; localizar una o más representaciones candidato de entre los datos fuente a través de la comparación de la representación subjetiva con los datos fuente; seleccionar una representación preferida de entre la una o más representaciones candidato, la representación preferida teniendo el parecido más cercano con la representación subjetiva; y la edición de la representación preferida. El método también puede incluir la revisión de los datos fuente para identificar uno o más registros seleccionados que contienen los datos preferidos; y agregar una nota de preferido a uno o más registros seleccionados.
El paso de seleccionar una representación preferida puede incluir la identificación de una nota preferida asociada con una o más representaciones candidato. El paso de localizar una o más presentaciones candidato también puede incluir: (a) analizar la representación subjetiva en uno o más artefactos diferentes; (b) seleccionar uno de los uno o más artefactos diferentes: (1 ) localizar uno o más artefactos candidatos de entre los datos fuente comparando el artefacto diferente de la datos fuente; (2) seleccionar un artefacto preferido de entre el uno o más artefactos candidato, el artefacto preferida teniendo un parecido más cercano con el artefacto diferente; (3) almacenar el artefacto preferido; (c) repetir el paso (b) para cada uno de los uno o más artefactos diferentes; y (d) combina los artefactos preferidos para formar una representación preferida. El paso de localizar una o más de presentaciones candidato también puede incluir almacenar datos alias en el tercero de los cuadros enlazados; revisar los datos alias para identificar uno o más de los registros alias seleccionados que contienen una representación alias preferida; agregar una nota de alias preferida al uno o más registros alias seleccionados; localizar uno o más alias candidato de entre los datos alias a través de la comparación de la representación subjetiva con los datos alias; seleccionar un alias preferido de entre el uno o más alias candidato, el alias preferidos estando más estrechamente asociado con la nota de alias preferida; y editar el alias preferido como una representación candidato.
El paso de localizar uno o más alias candidato también puede incluir (a) analizar la representación subjetiva en uno o más artefactos distintos; (b) seleccionar uno o más de los artefactos distintos; (1 ) localizar uno o más artefactos alias candidato entre los datos fuente, comparando el artefacto distinto con los datos alias; (2) seleccionar un artefacto alias preferido de entre el uno o más artefactos alias candidato, el artefacto alias preferido estando más estrechamente asociado con la nota alias preferida; (3) almacenar el artefacto alias preferido; (c) repetir el paso (b) para cada uno de los uno o más artefactos distintos; y (d) agregar el artefacto alias preferido a los alias preferidos. En otro aspecto de la presente invención, se provee un aparato para ejecutar los pasos del método descrito inmediatamente arriba. El aparato puede incluir una unidad de de procesamiento central; una memoria; un sistema de entrada/salida básico; un almacenamiento de programa que contiene un módulo de programa ejecutable a través de la unidad de procesamiento central, en la cual el módulo de programa puede incluir medios para ejecutar cada uno de los pasos del método descrito anteriormente. En otro aspecto de la presente invención, se provee un método para controlar el acceso a una base de datos mediante una o más aplicaciones externas. El método puede incluir establecer y almacenar una pluralidad de grupos de reglas, cada una correlacionada una con la otra o con más aplicaciones externas; recibir una solicitud de una primera aplicación; recibir un primer grupo de reglas correlacionado con la primera aplicación; aplicar el primer grupo de reglas para controlar la interacción entre la primera aplicación y la base de datos. El método, el primer grupo de reglas puede incluir una lista de datos disponibles para captura a partir de la base de datos para uso a través de la primera aplicación. En otro aspecto de la presente invención, se provee un método para controlar la profundidad de la captura de los datos dentro de una base de datos en respuesta una solicitud de una o más aplicaciones externas. El método puede incluir establecer y almacenar una pluralidad de grupos de reglas, cada una correlacionada una con la otra o con las aplicaciones externas, cada uno de la pluralidad de grupos de reglas incluyendo una lista de datos para captura a partir de la base de datos; recibir una solicitud de una primera aplicación; recuperar un primer grupo de reglas correlacionado con la primera aplicación; y aplicar el primer grupo de reglas para limitar los datos disponibles para la primera aplicación de la base de datos. En otro aspecto de la presente invención, se provee una estructura de datos que puede incluir una base de datos enlazada a un cuadro primario y uno o más cuadros secundarios, cada uno de los cuadros compartiendo una estructura de datos común; la base de datos controlada a través del sistema de administración de base de datos configurada para transformar uno o más de los cuadros primarios y uno más de los cuadros secundarios en una lista enlazada de matriz escasa. El sistema para la administración de la base de datos puede incluir una interfaz y un módulo de validación. La interfaz puede controlar el acceso a la base de datos a través de una o más aplicaciones externas. El sistema de administración de la base de datos puede estar configurado para convertir los datos de una representación subjetiva en una representación preferida. Estos y otros objetos se logran a través de los aparatos, métodos y sistemas descritos y serán aparentes a partir de la siguiente descripción detallada de una modalidad preferida en conjunción con los dibujos anexos en los cuales los números similares designan elementos similares.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La invención puede ser más fácilmente entendida a través de la referencia la siguiente descripción, tomada con los dibujos de las Figuras adjuntos, en donde: La Figura 1 es un diagrama de bloque de un supergrupo de direcciones de acuerdo con una modalidad de la presente invención. La Figura 2 es un diagrama de bloque de una base de datos genérica de acuerdo con una modalidad de la presente invención La Figura 3 es ilustración de una arquitectura del sistema de acuerdo con una modalidad de la presente invención. La Figura 4 es un diagrama de bloque de un modo del servicio independiente de acuerdo con una modalidad de la presente invención. La Figura 5 es una ilustración gráfica de un cuadro de datos de acuerdo con una modalidad de la presente invención.
La Figura 6 es una ilustración gráfica de los valores en un cuadro, de acuerdo con una modalidad de la presente invención. La Figura 7 es un diagrama de bloque de un enlace de acuerdo con una modalidad de la presente invención. La Figura 8 es un diagrama de bloque de una lista enlazada de acuerdo con una modalidad de la presente invención. La Figura 9 es una ilustración gráfica de un cuadro de datos de direcciones de acuerdo con una modalidad de la presente invención. La Figura 10 es una ilustración gráfica de los niveles y nodos de contención, de acuerdo con una modalidad de la presente invención. La Figura 11 es una ilustración gráfica de un cuadro de datos con notas, de acuerdo con una modalidad de la presente invención. La Figura 12 es una gráfica de flujo de un módulo de comparación, de acuerdo con una modalidad de la presente invención. La Figura 13 es una ilustración gráfica de un cuadro de los datos alias de acuerdo con una modalidad de la presente invención.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Ahora se hace referencia a las Figuras, en donde los números similares indican elementos similares a lo largo de las varias vistas. 1. Introducción Como se utiliza en esta solicitud, el término "componente de computadora" se refiere a una entidad relacionada con una computadora, ya sea hardware, firmware, software, una combinación de los mismos, o software en ejecución. Por ejemplo, un componente de computadora puede ser, pero no está limitado a, un proceso corriendo en un procesador, un procesador mismo, un objeto, un ejecutable, un argumento ejecución, un programa, un servidor, y una computadora. La manera ilustración, tanto el aplicación que corre en un servidor, el servidor mismo puede referirse común componente de computadora. Uno o más componentes de computadora pueden residir dentro de un proceso y/o argumento de ejecución y un componente de computadora se puede localizar en una computadora individual y/o distribuida entre y en medio de dos o más computadoras. "Comunicaciones de computadora", como se utiliza aquí, se refiere a una comunicación entre dos o más componentes de computadora y puede ser, por ejemplo, una transferencia de red, una transferencia de archivo, una transferencia de una pequeña aplicación, un corre electrónico, un mensaje del Protocolo de Transferencia de Hiper-Texto (HTTP), un datagrama, una transferencia de objeto, una transferencia de un objeto grande binario (BLOB), etc. Una comunicación de computadora puede a través de, por ejemplo, un sistema inalámbrico (por ejemplo, IEEE 802.11 ), un sistema Ethernet (por ejemplo, IEEE 802.3), un sistema de red de anillo (por ejemplo, IEEE 802.5), una red de área local (LAN), una red de área amplia (WAN), un sistema de punto a punto, un sistema de conmutación de circuito, un sistema de conmutación de paquete, etc. "Lógica", como se utiliza aquí, incluye, pero no se limita a hardware, firmware, software y/o combinaciones de cada uno para llevar a cabo una o más funciones u acciones. Por ejemplo, con base en aplicación o necesidades deseadas, la lógica puede incluir un microprocesador controlado por software, lógica discreta tal como el Circuito Integrado Específico de Aplicación (ASIC), u otros dispositivo de lógica programada. La lógica también se puede ejemplificar completamente como software. "Señal", como se utiliza aquí, incluye pero no se limita a una o más señales eléctricas u ópticas, análogas digitales, una o más instrucciones de computadora, un bit o una corriente de bits, etc. "Software", como se utiliza aquí, incluye pero no se limita a, una o más instrucciones legibles y/o ejecutables a través de computadora que originan que una computadora, un componente de computadora y/u otro dispositivo electrónico realice funciones, acciones y/o se comporte en una forma deseada. Las instrucciones se pueden ejemplificar en varias formas como rutinas, algoritmos, procedimientos almacenados, módulos, métodos, argumentos, y/o programas. El software también se puede implementar en una variedad de formas ejecutables y/u cargables incluyendo, pero no limitándose a, un programa independiente, una llamada de función (local y/o remota), un programa de servidor, una pequeña aplicación, instrucciones almacenadas en una memoria, un sistema operativo o navegador, y similares.
Se apreciará que las instrucciones legibles y/o ejecutables por computadora se puede localizar en un componente de computadora y/o distribuir se entre dos o más componentes de computadora en comunicación, co-operación, y/o procesamiento paralelo y de esta forma se pueden cargar y/o ejecutar en serie, en paralelo, masivamente en paralelo, y en otras formas. Se apreciará por un experto en la técnica en la forma de software puede depender de, por ejemplo, los requerimientos de un aplicación deseada, el entorno en el cual ópera, y/o los deseos de un diseñador o programador o similar. Una "conexión operable" (una conexión a través de las cual las entidades están "operablemente conectadas") es una en donde la señales, el flujo de la comunicación física y/o el flujo de la comunicación lógica se pueden enviar y/o recibir. Usualmente, una conexión operable incluye una interfaz física, una interfaz eléctrica, y/o una interfaz de datos, pero se observará que una conexión operable puede consistir de diferentes combinaciones de estos y otros tipos de conexiones suficientes para permitir el control operable. "Base de datos", como se utiliza aquí, se refiere a una entidad física y/o lógica que puede almacenar datos. Una base de datos, por ejemplo, puede ser una o más de las siguientes: un almacén de datos, una base de datos relacional, un cuadro, un archivo, una lista, una cola de espera, una pila, etc. Una base de datos puede residir en una entidad lógica y/o física y/o puede estar distribuida entre dos o más entidades lógicas y/o físicas. Los términos "impreciso" o "confuso" se refiere a un supergrupo de lógica Booleana que trata con el concepto de verdad parcial; en otras palabras, los valores verdaderos entre "completamente verdadero" y "completamente falso". Cualquier teoría o sistema específico se puede generalizar a partir de una forma distinta o precisa en una forma continua o confusa. Un sistema basado en lógica imprecisa o la comparación imprecisa puede utilizar valores verdaderos que tienen varios grados similares de probabilidades efecto los grados de verdadero no necesariamente necesitan sumarse a uno. En términos de aplicación de la comparación imprecisa a una cadena de caracteres alfa numéricos, el valor verdadero se puede expresar como el número de caracteres coincidentes en la cadena, por ejemplo. Los sistemas, métodos, y objetos descritos aquí se pueden almacenar, por ejemplo, en un medio legible por computadora. Los medios pueden incluir, pero no se limitan a, un ASIC, un CD, un DVD, un RAM, un ROM, un PROM, un disco, una onda portadora, una barra de memoria, y similar. De esta forma, un medio legible por computadora de ejemplo puede almacenar instrucciones ejecutables por computadora para un método para manejar los bienes de transportación. El método incluye calcular una ruta para un bien de transporte con base en el análisis de los datos recuperados de una experiencia basada en la base de datos del viaje. El método también incluye recibir datos en tiempo real del bien de transporte y actualizar la ruta para el bien de transporte con base en la integración de los datos en tiempo real con los datos del análisis. Se apreciará que algunos o todos los procesos y métodos el sistema involucran aplicaciones electrónicas y/o de software que puede ser procesos dinámicos y flexibles por lo que se pueden llevar a cabo en otras secuencias diferentes de aquellas descritos aquí. También se apreciará por un experto la técnica que los elementos ejemplificados como software se pueden implementar utilizando varios métodos de programación tales como lenguaje de máquina, de procedimiento, orientado al objeto, y/o técnicas inteligencia artificial. El procesamiento, análisis, y/o las otras funciones descritos aquí también se pueden implementar a través de circuitos funcionalmente equivalentes como un circuito de procesador de señal digital, un microprocesador controlado por software, un circuito integrado específico de aplicación. Los componentes implementados como software no están limitados a ningún lenguaje de programación particular. Más bien, la descripción aquí provee la información que un experto en la técnica puede utilizar para fabricar circuitos o para generar software de computadora para realizar el procesamiento del sistema. Se apreciará que algunas o todas funciones y/o comportamientos del presente sistema y método se pueden implementar como lógica como se definió anteriormente. Además, el alcance del término "incluye" que se emplea en la descripción detallada y las reivindicaciones, pretende ser inclusivo en una forma similar al término "comprendiendo" según ese término se interpreta cuando se emplea como una palabra temporal en una reivindicación. Además, al alcance de que el término "o" se emplea en las reivindicaciones (por ejemplo A o B) pretende significar "A o B o ambas". Cuando el autor intenta indicar "solamente A o B pero no ambas", el autor empleará la frase "A o B pero no ambas". De esta forma, el uso del término "o" aquí es de uso inclusivo, no de uso exclusivo. Ver Bryan A. Garner, A Dictionary Of Modern Legal Usage 624 (2a. edición, 1995). 2. Modalidad ilustrativa El sistema de la presente invención por lo general se describe aquí, a manera de ejemplo, en el contexto de su utilidad como un sistema para la administración de direcciones. Aunque el ejemplo relacionado con las direcciones se puede describir con considerable detalle, no es la intención de los solicitantes restringir fue ninguna forma limitan el alcance del invención ha dicho detalle. Los usos, aplicaciones, ventajas, y modificaciones adicionales del sistema de la invención serán fácilmente evidentes para aquellos con experiencia en la técnica. Por consiguiente, la invención, en sus aspectos más amplios, no está limitada a detalles específicos, los aparatos representativos, y los ejemplos ilustrados mostrados y descritos. Por consiguiente, se pueden hacer desviaciones de dichos detalles sin apartarse del espíritu o alcance del concepto general de la invención. Los aparatos, métodos, sistemas, procedimientos y similares de ejemplo, ahora se describirán con referencia los dibujos anexos, en donde los números de referencia similares se utilizan para referirse a elementos similares completamente. En la siguiente descripción, para propósitos explicación, se establecen numerosos detalles específicos con el fin de facilitar un entendimiento completo de los aparatos, métodos, sistemas, procedimientos y similares. Puede ser evidente, sin embargo, que los aparatos, métodos, sistemas, procedimientos y similares, se pueden practicar sin estos detalles específicos. En otras instancias, las estructuras y dispositivos bien conocidos se muestran en la forma de un diagrama de bloque con el fin de simplificar la descripción. 3. Estructura de datos: el supergrupo 3.1 Un supergrupo de datos En una modalidad, como se ilustra la Figura 2, el sistema de la presente invención puede incluir un supergrupo de datos 30. El supergrupo de datos 30 pueden incluir cuatro o más bases de datos relaciónales, diferentes 31 -35 (incluyendo las bases de datos Uno, Dos, Tres, Cuatro,...N, como se muestra). Las bases de datos 31-35 pueden estar conectadas a otras en una red de enlaces de bases de datos 36. En una modalidad, una de las bases de datos 31-35 pueden designarse como primaria y las otras como secundarias. Todas juntas, las varias bases de datos relaciónales 31-35 se pueden controlar a través de un sistema de administración de base de datos con el fin de crear un supergrupo de datos individual 30 es capaz de almacenar grandes cantidades de datos y ejecutar consultas complejas en una forma ordenada a través de todos los cuadros de las bases de datos relaciónales.
Las bases de datos relaciónales 31-35 pueden contener un grupo de cuadros 40 (incluyendo los Cuadros A, B, C.....N, como se muestra). Los cuadros 40 pueden contener un grupo de campos de datos 44 (incluyendo el Campol , Campo2, Campo3,...Campon, como se muestra). Los cuadros 40 pueden enlazarse juntos utilizando una o más claves 48 en una forma conocida en la técnica de las bases de datos relaciónales. En una modalidad, cada base de datos 31 de un 35 puede tener una estructura de datos común. En este aspecto, cada base de datos relación al 31- 35 puede incluir el mismo número de cuadros 40, y cada cuadro puede incluir el mismo número de campos 44. La estructura de datos común entre los varios cuadros 40 en el supergrupo de datos 30 puede proveer un grado de flexibilidad que permite el almacenamiento y procesamiento de cualquier tipo de datos. La estructura de datos común en una modalidad puede incluir la organización de los registros en uno o más cuadros 40 en orden jerárquico, en una serie de niveles de general a específico, con base en el valor del dato almacenado, como se describe con mayor detalle más adelante. Estructura de datos común también puede incluir el almacenamiento de cuadros 40, una lista enlazada de matriz escasa. 3.2 Un supergrupo de direcciones Una modalidad ilustrativa el supergrupo de datos se ilustra la Figura 1 . Un supergrupo de direcciones 130 puede incluir varias bases de datos relaciónales distintas, incluyendo en una modalidad una base de datos postal 131 , una bases datos de portador 132, una bases datos estándar 133, una bases datos de plan 134. Las bases de datos 131-134 pueden estar conectadas a otras en una red través de enlaces de bases de datos 36, como se muestra, para formar un supergrupo de direcciones 130. Las bases relaciónales 131-134 pueden estar controladas a través de un sistema de administración de base de datos de direcciones. Las bases de datos relaciónales 131-134 pueden contener un grupo de cuadros de datos 140, incluyendo en una modalidad una Cuadro Preferido 141 , un Cuadro de Alias de Direcciones 142, y un Cuadro de Alias de Destinatario 143, como se describe con mayor detalle más adelante. Los Cuadros Preferidos 141 también pueden incluir uno o más campos para almacenar una nota para actuar como un identificador único para un registro particular. Los cuadros 141 , 142, 143 pueden contener un grupo de campos datos 44 (incluyendo Campo , Campo2, Campo3,.... Campon, como se muestra). Los campos 141 , 142, 143 pueden estar enlazados juntos utilizando una o más claves 48 en una forma conocida en la técnica de las bases de datos relaciónales. En una modalidad, cada base de datos 131-134 puede tener una estructura de datos común. En este aspecto, cada base de datos relacional 31-134 puede incluir el mismo número de cuadros 141-143, y cada cuadro puede incluir el mismo número de campos 44. La estructura de datos común entre los varios cuadros en el supergrupo de datos de direcciones 130 puede proveer un grado de flexibilidad que permite el almacenamiento y procesamiento de cualquier tipo de datos. La estructura de datos común en una modalidad puede incluir la organización de los registros en uno o más cuadros en un orden jerárquico, en una serie de niveles de general a específico, con base en el valor de los datos de direcciones almacenados, como se describe con mayor detalle más adelante. Estructura datos común también puede incluir el almacenamiento o reformateo de los cuadros como una lista enlazada de matriz escasa. 4. Arquitectura del sistema La Figura 3 es un diagrama que representa el sistema 10 de acuerdo con una modalidad de la presente invención. El sistema 10 puede incluir un servidor de infraestructura 25, una o más redes de computadora, un servidor de aplicación 200, y uno o más clientes 655 distribuidos en una relación servidor-cliente multidimensional. La una o más redes de computadora facilitan las comunicaciones entre el servidor de infraestructura 25, el servidor de aplicación 200, y el uno o más clientes 255. La una o más redes de computadora pueden incluir una variedad de equipos de redes de computadora tales como el Internet, una Intranet privada, una extranet privada, una red telefónica de conmutación pública (PSTN), una red de área amplia (WAN), una red de área local (LAN), o cualquier otro tipo de reconocido la técnica.
Como se muestra en la Figura 3, un servidor AMS primario 510 puede residir en un servidor de infraestructura 25. Una interfaz de usuario gráfica tal como una GUI AMS 324 puede comunicarse con el servidor AMS primario 510 como se muestra. El siguiente nivel en el sistema 10 en una modalidad puede incluir varios clientes AMS 655 y un servidor AMS secundario 520. Algunos de los clientes AMS 655 pueden incluir una estación de trabajo de captura de datos 155 y una GUI 26 para uno o más usuarios 28. En una modalidad, un servidor aplicación 200 puede residir en un cliente AMS 655. Descendiendo desde el servidor AMS secundario 520, en una modalidad, el siguiente nivel puede incluir varios clientes AMS 655, cada uno incluyendo una estación de trabajo de captura de datos 155, y una GUI 26 para uno o más usuarios 28. El servidor de infraestructura 25 en una modalidad ilustrativa, puede incluir un procesador central que se comunica con los otros elementos dentro del servidor de infraestructura 25 a través de una interfaz o conductor común del sistema. También se puede incluir en el servidor de infraestructura 25 un dispositivo de captura y despliegue para recibir y desplegar los datos. El dispositivo de captura y despliegue puede ser, por ejemplo, un teclado, un dispositivo de apuntamiento utilizado en combinación con un monitor. El servidor de infraestructura 25 además puede incluir una memoria, que puede incluir tanto memoria de sola lectura (ROM) como memoria de acceso aleatorio (RAM). ROM se puede utilizar para almacenar un sistema de 5 entradas/salidas básico (BIOS), que contienen las rutinas básicas que ayudan a transferir la información entre y en medio de los elementos del servidor de infraestructura 25. Además, el servidor de infraestructura 25 puede incluir por lo menos un dispositivo de almacenamiento, tal como una unidad de disco duro, una unidad de disco flexible, una unidad CD-ROM, una unidad de disco óptico, para almacenar la información en varios medios textiles por computadora, tales como disco duro, un disco magnético removible, un disco CD-ROM. Cada uno de estos tipos de dispositivos de almacenamiento puede estar conectado al conductor común del sistema a través de una interfaz apropiada. Los dispositivos de almacenamiento y sus medios legibles por computadora asociados pueden proveer almacenamiento no volátil. Es importante observar que los medios legibles por computadora descritos anteriormente pueden reemplazarse por cualquier otro tipo de medio legible por computadora conocido en la técnica. Dichos medios incluyen, por ejemplo, casetas magnéticos, tarjetas de memoria no volátil, disco de videos digitales, y cartuchos Bernoulli. Se pueden almacenar un número de módulos de programa a través de varios dispositivos de almacenamiento en RAM. Dichos módulos de programa incluyen un sistema operativo y una o más aplicaciones. También localizado dentro del servidor de infraestructura 25 puede haber una interfaz de red, para interconectar y comunicarse con otros elementos de una red de computadoras. Uno o más componentes del servidor de infraestructura 25 pueden estar geográficamente remotos de otros componentes de procesamiento. También, se pueden combinar uno o más de los componentes. El servidor de infraestructura 25 puede incluir componentes adicionales para llevar a cabo las funciones descritos aquí. 4.1 Un sistema de administración de base de datos (DBMS) De acuerdo con una modalidad de la presente invención, un sistema para la administración de base de datos (DBMS) haciendo referencia otra vez a la Figura 3, puede residir en un servidor AMS primario 510 (el servidor de infraestructura 25), un Servidor de Aplicación 200, o un servidor AMS secundario 520. El DBMS puede incluir una interfaz 600 y un paquete de programas 500, similar al AMS 1 10 mostrado en la Figura 4. A manera ejemplo, un sistema para la administración de base de ciatos (DBMS) de la presente invención pueden inscribirse en el contexto de su utilidad como sistema para la administración de direcciones (AMS) 110. Como el DBMS, el AMS 110 puede residir en un servidor AMS primario 510 (el servidor de infraestructura 25), un Servidor de Aplicación 200, o servidor AMS secundario 520. En una modalidad, el AMS 1 10 puede incluir una interfaz 600, y un paquete de programas 500, como se muestra la Figura 4. La Figura 4 es un diagrama de bloque de un sistema 10 de acuerdo con una modalidad de la presente invención que describe un AMS 1 10 operando en un Modo de Servicio Independientes 640. El sistema 10 como se muestra incluye una computadora 15 que provee acceso a uno o más usuarios 28 a través de una GUI AMS 324. 4.2 Un sistema de administración de direcciones (AMS) El sistema para la administración de direcciones (AMS) 110 puede ser específicamente diseñado para controlar la organización, almacenamiento, y recuperación de los datos en un supergrupo de datos de direcciones 130, y para controlar la segundad e integridad del supergrupo de direcciones 130 y sus bases de datos del componente. La interfaz 600 puede estar configurada para aceptar y procesar solicitudes para recibir datos de aplicaciones externas (no mostrado). En una modalidad, la interfaz 600 puede ser una interfaz basada en COM con la capacidad de crear, leer, actualizar, y eliminar registros. La interfaz 600 también puede incluir una función de consulta para llevar a cabo operaciones sobre los datos almacenados en el supergrupo de direcciones 130. 5. Encontrando una representación preferida En una modalidad, el sistema 10 de la presente invención puede incluir un sistema para la administración de la base de datos (DBMS) para un supergrupo de datos 30. El DBMS también puede ser útil como un sistema de administración de base de datos para cualquier tipo de datos, incluyendo datos de direcciones. En el contexto de los datos de direcciones, el DBMS puede ser referido como sistema de administración de direcciones (AMS) 1 10.
En cualquier capacidad, sistema de administración 110 puede incluir una interfaz 600 y un paquete de programas 500. En una modalidad, el paquete de programas 500 puede incluir uno o más programas de software de computadora para recibir datos brutos en una "representación subjetiva", analizar los valores almacenados en una base de datos a través del uso de una interfaz 600 para ejecutar una o más consultas, y producir datos de salida en una "representación preferida". El término "representación subjetiva" se utiliza aquí para indicar datos brutos capturados o sometidos por alguien cuyo entendimiento de los datos puede ser personal para ese individuo. Las representaciones subjetivas tienden a ser ambiguas o incompletas, lo que puede ser problemático cuando los datos en bruto son necesarios para llevar a cabo los pasos de computación. Por ejemplo, una persona puede capturar una fecha de nacimiento utilizando la representación subjetiva "12-4-63". En Estados Unidos, esta fecha puede indicar "Diciembre 4", mientras en Europa puede significar "12 de abril". Un componente de computadora puede interpretar el año como 1963 o 63. Estas ambigüedades tienen un ser impacto sobre la precisión de los datos en bruto. Para remover las ambigüedades del estado incompleto, un paquete de programas 500 puede diseñarse para convertir la representación subjetiva en una "representación preferida". Dicho paquete de programas 500, por ejemplo, puede incluir sistema o consulta para determinar si el usuario está capturando la fecha en el formato de Estados Unidos o el formato europeo. Un paquete de programas 500 también puede incluir reglas una configuración de rutina lógica de ceros como el siglo por omisión para todos los años capturados, a menos que el usuario capture un año de cuatro dígitos. El diseño y la construcción de un paquete de programas 500 requieren de la previsión y planeación de los tipos y formato de datos brutos que se esperan en un sistema particular. Una representación subjetiva se puede procesar a través de un paquete de programas 500 en una representación preferida está generalmente no relacionada con los datos en bruto. Por ejemplo, un cliente puede ordenar un cartucho de impresión utilizando la representación subjetiva "Acema LX-709 Color" en donde Acmé es el fabricante de impresora, LX-709 es el número de modelo de la impresora, y se desea tinta de color. En un sistema para procesar órdenes de cartuchos de impresión, por ejemplo, los cartuchos de pueden catalogar y almacenar utilizando un número de serie de cartuchos de 10 dígitos. El número de serie no está directamente relacionado con el texto y los dígitos en los datos en bruto; sin embargo, número de serie es la "representación preferida" que se va a imprimir en una orden de compra, por lo que el vendedor puede localizar y embarcar el cartucho deseado. Para comparar los datos en bruto subjetivos con el número de serie correcto, un paquete de programas 500 se puede escribir para interpretar cualquier variedad de indicadores potenciales sometidos por un cliente. Suponer que los primeros cuatro dígitos de cada número de serie del cartucho corresponden a una lista de fabricantes de impresoras que construyen máquinas capaces utilizar ese tipo de cartucho. Un paquete de programas 500 puede incluir un procedimiento almacenado para comparar el nombre del fabricante de impresoras capturado con los nombres en la lista, y encontrar los primeros cuatro dígitos correspondientes del número de serie del cartucho. Esto representa un primer paso hacia el hallazgo del número de serie de 10 dígitos para imprimir la orden de compra. Otro ejemplo de una representación subjetiva es una dirección de calle común. En una pieza de correo, una persona puede escribir la representación subjetiva "Doe, 123 East Main Street N.W., Suite A-4, Atl 30030". Varios partes de la dirección son ambiguas o incompletas, incluyendo el destinatario "Doe", la abreviatura "Atl", y el nombre faltante del estado. Si estos datos fueran destinados para procesamiento a través de una computadora un equipo de clasificación, estas ambigüedades darían como resultado la pérdida, retraso, o distribución incorrecta de la pieza de correo para remover las ambigüedades y característica de incompleto, se puede diseñar un paquete de programas 500 para convertir la representación subjetiva en una representación preferida. Dicho paquete de programas 500, por ejemplo, puede incluir un programa o un procedimiento almacenado para comparar la dirección escrita con una base de datos de computadora comercialmente disponible de direcciones de calles y códigos postales. Los ejemplos descritos anteriormente se refieren a un atributo o parámetro, una fecha, un número de parte, una dirección. Un parámetro se puede caracterizar en una variedad de formatos, incluyendo las representaciones subjetivas mostradas anteriormente y otras representaciones que dependen del contexto de uso. El sistema de la presente invención, en una modalidad, utiliza datos tabulados para manipular y modificar la forma que se caracteriza un parámetro, como se describe con mayor detalle más adelante. En una modalidad, el sistema de administración de base de datos (DBMS) de la presente invención, puede incluir un paquete de programas 500, que pueden incluir uno o más de las siguientes procedimientos generales: (1 ) un módulo de Mejoramiento; (2) un módulo de Publicar y Suscribir; y (3) un módulo de Comparación. El paquete de programas 500 puede incluir componentes y procedimientos adicionales, por supuesto, para llevar a cabo las otras funciones descritas en esta solicitud. 5.1 Un módulo de mejoramiento En una modalidad, el paquete de programas 500 de la presente invención puede incluir un módulo de Mejoramiento adecuado para utilizarse en la optimización de la estructura y el orden de los datos almacenados en las bases de datos relaciónales 31-35 de un supergrupo de datos 30. Cada base de datos 31 en 35 en un supergrupo de datos 30 puede incluir millones de registros. Las tareas de leer, actualizar, y buscar a través de todos o la mayor parte de los registros en cada base de datos 31-35 puede mejorarse y agilizarse, en una modalidad, mediante la optimización del estructura de los datos.
Los cuadros de la base de datos que incluyen un gran número de registros consumen grandes cantidades de memoria y requieren de tiempos de computación prolongados para llevar a cabo la clasificación, búsqueda, y otras operaciones analíticas. Un ejemplo simple de mejoramiento u optimización de datos es clasificado registros con base en uno o más atributos (columnas), para colocar los registros en orden, en incremento o decremento. Para grandes cuadros con múltiples atributos, sin embargo, una simple clasificación de registros no produce ahorros significativos de tiempo o eficiencia de búsqueda. En una modalidad, una clase de módulo de Mejoramiento en el paquete de programas 500 incluye un procedimiento para transformar una base de datos en una lista enlazada de matriz escasa. Una lista enlazada incluye un enlace designado para dirigir una consulta desde un campo al siguiente, algunas de sus utilizando el enlace para pasar de de largo o saltarse campos irrelevantes. Una matriz escasa no incluye campos repetidos en registros subsecuentes. En vez de repetir un primer valor, los campos subsecuentes se dejan en blanco, y los valores subsecuentes se presume que son iguales al primer valor a menos que y solamente cuando aparece un valor diferente. Por ejemplo, la Figura 9, el campo del CP. incluye una entrada repetitiva (el CP. 20001 ) en cada uno de los 13 registros. En un aspecto, el sistema 10 de la presente invención utiliza el concepto de una matriz escasa para eliminar las entradas repetitivas y por lo tanto ahorrar memoria y acortar los tiempos de computación. En la Figura 9, por ejemplo, el CP. para el Nodo 1 se puede popular a través del CP. 20001 de cinco dígitos. En el sistema 10 de la presente invención, cuando un cuadro se puede transformar en una matriz escasa, los campos de CP. subsecuentes podrían estar vacíos o con ceros. En la Figura 9, el campo del CP. para el Nodo 2 al Nodo 13 podría estar vacío o con cero; y el valor en ésos campos podría presumirse que es 20001. En la matriz escasa el valor encontrado en la secuencia de registros se presume que permanece igual hasta que aparece un valor diferente. Debido a que muchos valores repetidos se pueden eliminar en esta forma, el cuadro o matriz se describe como estando escasa. Cualquier atributo en un cuadro se pueda ser poco denso aplicando las reglas para crear una matriz escasa. Una pequeña porción de un cuadro de base de datos modelo 40 se muestra la Figura 5. Cada fila contiene un solo registro 42. Cada campo 44 se puede localizar mediante la referencia a los números de fila y columna. El campo localizado en la Fila 3 de la Columna 2, por ejemplo se puede escribir como el Campo (3, 2) o simplemente (3, 2). La norma para la denominación del campo es valiosa en muchas operaciones de la base de datos en donde se desea apuntar hacia un campo particular. El cuadro 40 de la Figura 6 es un ejemplo de una matriz escasa. La columna 2, por ejemplo, empieza con el valor "Smith" en la Fila 1 y se sigue en los registros subsiguientes (fila) por un valor de ser. Por consiguiente, el valor de la Columna 2 se entiende que es "Smith" en las fila subsecuentes 2, 3, 4. La norma para la denominación de la fila y columna para los campos es útil cuando un cuadro está organizado como una lista enlazada. En un tipo de lista enlazada, el enlace 340 puede incluir un campo 44, un valor 46, y uno o más apuntadores, como se muestra la Figura 7 yen la Figura 8. En un tipo de enlace 340, mostrado la Figura 7, un apuntador de siguiente en la columna 344 está incluido, junto con un apuntador siguiente en la fila 342. Los apuntadores 344, 342 incluyen instrucciones para que siguiente campo contenga un valor no de cero. Debido a que apuntan hacia siguiente campo (según opuesto al último campo) estos apuntadores 344, 342 son referidos como apuntadores hacia adelante. Algunos tipos de lista enlazadas también incluyen apuntadores hacia atrás, con instrucciones dirigidas hacia el último o previo valor de campo no de cero. En un aspecto, el sistema 10 de la presente invención puede incluir solamente apuntadores hacia adelante. La Figura 8 es una representación de los enlaces 340 entre los valores de la matriz escasa mostrados en la Figura 6. Las instrucciones en el enlace 340 para la Fila 4, Columna , por ejemplo podrían rápidamente dirigir el análisis hacia siguiente valor no de cero localizado en la Fila 4, Columna 3. Las infecciones contenidas en el enlace 340 permiten un proceso analítico tal como una consulta de búsqueda para pasar de largo o saltarse los campos vacíos en una matriz escasa. Al saltarse los campos vacíos, el tiempo de búsqueda es enormemente reducido, se producen resultados más rápidos a partir de la consulta. En una modalidad, un paquete de programas 500 incluyendo un módulo de Mejoramiento se puede utilizar para transformar cualquier cuadro en un supergrupo de datos 30 en una lista enlazada de matriz escasa. Un supergrupo de datos 30 almacenado como una lista enlazada de matriz escasa puede consumir mucho menos memoria, y por consiguiente puede ser más adecuada para la distribución como un supergrupo duplicado 330 para los clientes suscriptores 255. Cuando un cuadro de datos ha sido transformado en cuadro de lista enlazada de matriz escasa (SMLL), el módulo de Mejoramiento puede finalizar por el contrario "envolver" el cuadro SMLL para prepararlo para la distribución y uso a través de otros componentes del sistema y en cualquier otro lugar. Como se muestra en las Figuras 5-8, un supergrupo duplicado 330 puede residir en uno o más clientes 255 el sistema 10. La transmisión o "publicación" de un supergrupo duplicado 330 a lo largo del sistema 10 se puede lograr utilizando un módulo de Publicar y Suscribir, como se explica más adelante. El módulo de Mejoramiento en una modalidad también puede monitorear la condición de los cuadros según se agregan nuevos datos, mantener los cuadros en una condición óptima a través de la repetición del procedimiento de transformación según sea necesario, y comunicando se con otros componentes del sistema con respecto a la condición de los cuadros y su disponibilidad para compartirse o distribuirse a los clientes suscriptores 255. En este aspecto, la porción de Mejoramiento del paquete de programas 500 puede configurarse para interactuar comunicarse con otros componentes del sistema para mantener los cuadros de datos en una condición óptima para una rápida y eficiente búsqueda. 5.2 Un módulo de publicar y suscribir En una modalidad, el paquete de programas 500 de la presente invención puede incluir un programa de publicación y suscripción o procedimiento para controlar y facilitar la transferencia de los datos entre los componentes del sistema 10 de la presente invención. Como se ilustra la Figura 3, el sistema 10 puede incluir un servidor de infraestructura 25, una o más redes de computadora 230, un servidor de aplicación 200, y uno o más clientes 255 distribuidos en una relación servidor-cliente. En un entorno de red servidor-cliente, tal como aquél ilustrado en las Figuras5-9 por ejemplo, un supergrupo duplicado 330 puede residir en uno o más clientes suscriptores 255 el sistema 10. El módulo de Publicar y Suscribir puede estar configurado para monitorear y controlar la publicación de un supergrupo duplicado 330 a través del sistema 10 para los clientes 255 que son suscriptores. 5.3 Un módulo de comparación En una modalidad, el paquete de programas 500 de la presente invención puede incluir un módulo de Comparación 85 configurado para recibir datos en bruto en una representación subjetiva 80, analizar los valores almacenados en el supergrupo de datos 30 utilizando una interfaz 600 para ejecutar una o más consultas, y producir datos de salida en una representación preferida 90. Los pasos generales en un módulo de Comparación ilustrativo 85 se muestra en como una gráfica de flujo en la Figura 12. Los pasos para encontrar y desplegar los datos en su representación preferida 90, se basan en una representación subjetiva 80, en una modalidad puede involucrar las siguientes funciones generales: captura 300, análisis 305, estandarizar 310, validar 320, actualizar 380, combinar 390, y editar 395. Un experto la técnica puede entender que estos pasos generales no necesariamente necesitan ocurrir en este orden, y algunos pasos se pueden repetir según sea necesario, de acuerdo con uno o más algoritmos específicos. 5.3.1 Captura El paso referido como captura 300 en una modalidad puede involucrar la captura o por el contrario la recepción de la representación subjetiva 80 (datos de captura). 5.3.2. Análisis El paso referido al análisis 305 en una modalidad puede involucrar el análisis de la representación subjetiva 80 en sus partes componentes. La tarea de realizar generalmente involucrar la división de una frase o cadena de caracteres en sus partes componentes. En el contexto de una dirección de calle, por ejemplo, la dirección escrita en el sobre representa una representación subjetiva 80 que se puede dividir en varios diferentes componentes o artefactos a través del procedimiento de análisis. Un algoritmo o programa de análisis generalmente recibe la entrada como una secuencia o cadena de caracteres y después aplica un grupo de reglas para lograr la división por categoría. Un ejemplo de una representación subjetiva 80 es una dirección de calle. Por ejemplo, una dirección de calle de Estados Unidos tal como "123 East Main N.W., Suite A-4" puede incluir un número de artefactos distintos, incluyendo un Número ( 23), un Pre-direccional (East), un Nombre Primario (Main), un Tipo (Calle), un Pos-direccional (NW), un Nombre Secundario (Suite), y un Número Secundario (A-4). Una dirección de calle también se puede analizar en componentes basados en sus subdivisiones políticas tales como ciudades, municipios, y estados, o se puede analizar a un nivel máximo de detalle o granularidad, con base en el CP. +4, por ejemplo. Al analizar una representación subjetiva 80 y almacenar sus partes componentes en campos separados de un cuadro, por ejemplo, el módulo de Comparación 85 de la presente invención puede permitir a los usuarios acceder y resumir (o "abstraer") los datos en una variedad de formas, dependiendo de la necesidad y la aplicación. Por ejemplo, un usuario puede solicitar un resumen o abstracción de datos de direcciones con base en el CP. de cinco dígitos en un estado particular. Si los datos de la dirección han sido analizados y el CP. se almacena en un campo distinto, el paso de a abstraer los datos con base en el CP. involucrar una búsqueda y recuperación relativamente simples. El almacenamiento de los artefactos en campos separados puede permitir al usuario investigar y recuperar datos utilizando cualquier nivel de abstracción. En este aspecto, la invención provee mucha flexibilidad para varios usuarios con varias necesidades. 5.3.3. Estandarizar El paso referido como estandarizar 310 en una modalidad generalmente puede involucrar el re-formateo de una representación subjetiva 80 de acuerdo con un grupo de reglas estandarización. La estandarización general puede involucrar muchas características de una representación subjetiva 80, incluyendo la fuente, el espaciado, el tipo de letra, la puntuación, si un campo puede incluir caracteres alfabético o numéricos, o ambos, la longitud del campo, el tamaño la capacidad del campo, y otros aspectos. En el contexto de una dirección de calle por ejemplo, una representación subjetiva 80 se puede escribir como: John Doe 123 East Main Street, N. W.
Oakland Center, Suite A-4 Altanta, Georgia 30030 El paso referido como una estandarización 310 puede estar la fuente, el espaciado, la puntuación, y otros aspectos de la representación subjetiva 80 anterior, el tal forma que después de la estandarización puede aparecer como: JOHN DOE 123 E HAIS ST UW ST£ A4 DECATUH GA 30030-15 9 ?,,??,??,,,?? ,, ,,??,??,,,,, ,??,?,?.G,??,?,,, ,?,?,,? ?, ??:,, ! El paso de estandarización 310 en una modalidad puede incluir un grupo variable de reglas, dependiendo del tipo de dirección y la región o país. La direcciones foráneas, por ejemplo, pueden tener muy diferentes reglas que gobiernan la presentación estándar de los varios artefactos de la dirección. Por ejemplo, las siguientes representaciones subjetivas 80 se pueden estandarizar: Representación subjetiva 80 Estandarizada: Prielle Kelia U. 19-15 BUDAPEST XI Budapest H-2100 PRIELLE KELIA U. 19-35 Hungary HUNGARY Representación subjetiva 80: Estandarizada: V. Delle Terme LARGO DELLE TERME Rome 00100 00153 - ROMA RM Italy ITALY Representación subjetiva 80: Estandarizada: 103 New Oxford 103 NEW OXFORD ST London WC1A PG LONDON Great Britain WC1A 1 PG UNITED KINGDO El paso de estandarización 310 puede llevar a cabo en conjunción con el paso de análisis 305 por lo que ios artefactos analizados se almacenan en los cuadros en su formato estandarizado. En una modalidad, el paso de estandarización 310 puede llevar a cabo en cada artefactos separado después de analizarlo, mientras que en el otro el paso de análisis de 305 puede tomar lugar primero. Como con los otros pasos generales en el módulo de Comparación 85, los pasos de estandarización 310 y análisis 305 pueden tomar lugar en cualquier orden, y se pueden repetir. 5.3.4. Módulo de validación El paso referido como validación 320 en una modalidad puede involucrar series complejas de pasos que se realizan para validar una representación subjetiva 80, como se escribe con mayor detalle más adelante. La validación de 320 generalmente involucra la verificación de la precisión y actualidad de una representación subjetiva 80. La validación 320 también puede incluir comparar una representación subjetiva 80 con los valores almacenados en los cuadros en el supergrupo 30 y por lo tanto buscar una representación preferida 90. 5.3.5. Actualización El paso referido como actualización 380 en una modalidad puede involucrar agregar datos recientemente adquiridos a una de las bases datos relaciónales en el supergrupo 30. En este aspecto, el supergrupo 30 por y a través de la operación del paquete de programas 500 puede actualizarse continuamente con base en los nuevos datos. El paso de actualización 380 puede ocurrir en cualquier momento durante los procedimientos ejecutados a través del módulo de Comparación 85. En una modalidad, el paso de actualización 380 puede agregar nuevos datos a uno de los cuadros en el supergrupo. Los datos se pueden colocar en registros localizados cerca del final de un cuadro. En un aspecto de la invención, el cuadro puede o no puede volverse recopilar antes de que se ejecuten las tareas del módulo de mejoramiento. Los cuadros como se designan no requieren de una compilación frecuente. 5.3.6. Combinar El paso referido como combinar 390 en una modalidad puede involucrar la inversión del paso de análisis 305, en que los artefactos separados de una representación subjetiva 80 se vuelven a ensamblar. En una modalidad, el paso de combinar 390 se ejecuta después de que el paso de validación 320 ha producido los artefactos de una representación preferida 90. 5.3.7. Edición y despliegue El paso referido como edición 395 en una modalidad puede involucrar la transmisión o envío de la representación preferida 90 (una nota preferida) a uno o más componentes del sistema 10 de la presente invención. En este aspecto, el paso de edición 395 se pueden escribir como devolver o pública los resultados de la consulta de búsqueda. El paso de edición 395 también puede incluir o ser seguido por un paso de despliegue, en donde la representación preferida 90 se puede desplegar en un monitor u otro tipo de pantalla de un usuario. El paso de edición 395 además puede incluir o ser seguido por un paso de impresión, en donde la representación preferida 90 se puede imprimir sobre una etiqueta, en una lista, como parte de un reporte, o por el contrario enviarse en un formato de texto legible, dirigido a través del sistema. 5.4. Módulo de validación El paso de validación 320 en una modalidad generalmente puede incluir la comparación de una representación subjetiva 80 con los valores almacenados en el cuadro en el supergrupo 30 y por lo tanto buscar una representación preferida 90. En el contexto de un sistema para la administración de direcciones 1 10, la validación de la dirección 320 generalmente involucra la comparación de la representación subjetiva 80 de una dirección capturada con los valores almacenados en las bases datos de direcciones 131 , 132, 133 en un supergrupo de direcciones 130 (como se muestra la Figura 1), e identificar la representación preferida 90 para la direcciones. Como se ilustra la Figura 1 , el supergrupo de direcciones 130 puede incluir en una modalidad una base datos postal 31 , una base de datos deportados 132, una base de datos estándar 133, y una base de datos de plano 134. Cada base de datos relacional 131-134 pueden incluir en una modalidad de un cuadro preferido 141 , un cuadro de alias de calles 142, y un cuadro de alias de destinatario 143. Los cuadros preferidos 141 también pueden incluir uno o más campos para almacenar una nota que actúa como un identificador único para un registro particular.
La Base de datos postal 131 en una modalidad puede incluir los datos de direcciones de un servicio postal, tal como el Servicio Postal de Estados Unidos (USPS). Estados Unidos incluye más de 145 millones de direcciones que se pueden distribuir. El USPS ofrece una variedad de bases de datos de direcciones al público que se actualizado regularmente, incluyendo el Archivo de Secuencia de Distribución (DSF). DSF es una base de datos computarizada desarrollada por el USPS que incluye una dirección estandarizada, completa, almacenada en un registro distinto, para cada punto de entrega que sirve a través del USPS. Cada registro separado contiene la dirección de la calle, el C . + 4, el código de la ruta del portador, el número de secuencia de entrega (número de secuencia de camino), un código de tipo de entrega, y un indicador de entrega por estaciones. El USPS recientemente desarrollo una nueva base de datos Validación del Punto de Entrega (DPV) para reemplazar DSF. La base datos DPV está disponible en su formato básico o en su formato mejorador denominado DSF2 (que incluye atributos de dirección adicionales). Muchos países y regiones extranjeras ofrecen bases datos similares a los registros de dirección postal, incluyendo direcciones estandarizadas de acuerdo con las necesidades y reglas particulares del país. La base datos postal 131 de la presente invención se puede configurar para recibir y almacenar cualquiera de una variedad de bases de datos conteniendo direcciones costales. Dentro de la base datos postal 131 , el cuadro preferido 141.1 puede configurarse para aceptar y almacenar la representación preferida para: entrega servidos por la autoridad postal. La representación preferida se puede almacenar como un todo, o como artefactos separados, o ambos. El cuadro preferido postal 141.1 puede ser una de las fuentes primarias de las representaciones preferidas 90 de direcciones. Una autoridad postal también puede proveer datos de alias de calles que pueden ser aceptados almacenados en el cuadro de alias de calles 142.1. Un alias, como el nombre implica, se refiere a la situación en donde varios diferentes identificadores se refieren el mismo objeto. Un ejemplo común de un alias de calle ocurre cuando una carretera tiene múltiples nombres: el nombre de una calle local, el número de una ruta estado, y el número de una autopista federal. Por ejemplo, la Autopista E.U.A. 1 también puede ser referida como la Ruta Estatal 16 en un estado particular, y también como Calle Maple cuando pasa a través de un pueblo particular. En la región en donde los tres nombres se aplican, los nombres de la calle Calle Maple, Ruta Estatal 16, y Autopista E.U.A. 1 son alias de calle. Además, una lista de alias de calles también puede incluir S.R. 16, Ruta 16, E.U.A. 1 , Ruta 1 , o Avenida Maple, por ejemplo, si estos nombres están en uso. Una base de datos de USPS por lo general por incluir datos de alias de calle. El cuadro de alias en calle 142.1 se puede configurar para aceptar y almacenar los datos de alias de calle provistos por la autoridad postal. Otras características de artefactos también son sujetos de solapamiento. Por ejemplo, un nombre de compañía formal puede incluir términos que típicamente no están incluidos al público. Por ejemplo, la Acmé Shoe Corporation puede ser referida en el lenguaje diario como Acmé Shoes o simplemente Acmé. El problema creado por los diferentes nombres o alias para un valor que ser almacenar en una base de datos surge cuando un usuario de la base de datos quiere recuperar ese valor específicamente. Una búsqueda de Acmé Shoe Corporation, por ejemplo, puede encontrar registros tan simples como Acmé Shoes. El cuadro de alias de destinatario 143.1 puede configurarse para aceptar y almacenar los datos de alias de destinatario provistos por la autoridad postal, cuando están disponibles. Una autoridad postal puede o no puede proveer los datos de alias destinatario. En algunas jurisdicciones, como Estados Unidos, el servicio postal no puede distribuir datos revelando la identidad de los residentes (destinatario) en conexión con una dirección de calle. Los campos de datos mostrados para el cuadro de alias de destinatario 143.1 (Campol , Campo2, Campo3,...Campon) son precedidos por un guión en lugar de un signo +, para indicar que estos campos pueden estar en blanco. Los cuadros 141.1 , 142.1 , 143.1 de la base de datos postal 131 pueden enlazarse o por el contrario interconectarse utilizando uno o más campos clave, en una forma conocida en la técnica de las base datos relaciónales. La Base datos portador 132 en una modalidad puede incluir los datos de las direcciones de una fuente privada, tal como un portador de fletes comercial, un servicio de mensajería, un proveedor de base de datos privados. Algunas compañías de distribución y otros proveedores de servicio desarrollan y mantienen bases datos de direcciones, algunas de las cuales pueden hacerse disponibles. La base datos portador 132 de la presente invención se puede configurar para recibir y almacenar cualquiera de una variedad de bases datos privadas conteniendo información de direcciones. En la base datos portador 132, el cuadro preferido 141 .1 puede estar configurado para aceptar y almacenar la representación preferida para los puntos de distribución contenidos en una base datos fuente privada. La representación preferida se puede almacenar como un todo, como artefactos separados, o ambos. Una fuente privada también puede proveer datos de alias de calles que pueden aceptarse y almacenar en el cuadro de alias de calles 142.2. Algunas compañías de distribución y otros proveedores de servicio desarrollan y mantienen listas de alias de calles para los territorios a los que sirven. El cuadro de alias de calles 142.2 puede configurarse para aceptar y almacenar los datos de alias de calles provistos por cualquier fuente privada. El cuadro de alias de destinatario 143.2 puede configurarse para aceptar y almacenar los datos de alias de destinatario provistos por una fuente privada. Además de los alias de calles, muchas compañías de distribución y otros proveedores de servicio desarrollan y mantienen listas de usuarios o clientes (destinatario) que pueden incluir alias. El cuadro de alias el destinatario 143.2 puede configurarse para aceptar y almacenar los datos de alias de destinatario provistos por cualquier fuente privada. Los cuadros 141.1 , 142.2, 143.2 de la bases datos de portador 132 pueden enlazarse o por el contrario interconectarse utilizando uno o más campos clave, en una forma conocida en la técnica de las bases de datos relaciónales. Similarmente, la base datos portador 132 pueden enlazarse por el contrario interconectarse con la base datos postal 131. La Base datos estándar 133 en una modalidad puede incluir datos de alias, generalmente. Durante la subida de los archivos y la instalación de la base datos postal 131 y la base datos portador 132, el sistema 10 de la presente invención puede incluir una herramienta para recolectar información de alias de calles y de alias de destinatario y almacenarla en la base datos estándar 133. El cuadro de alias de calle estándar 142.3 puede configurarse para aceptar y almacenar datos de alias de calles. El cuadro de alias destinatario estándar 43.3 puede configurarse para aceptar y almacenar datos de alias destinatario. En este aspecto, la base datos estándar 133 en una modalidad puede actuar común depósito de datos de alias. Debido a que la base datos estándar 133 es generalmente para datos de alias, puede o no puede incluir cualquier preferido en el cuadro 141.3 los campos de datos para el cuadro preferido estándar 141.3 (Campol , Campo2, Campo3,...Campon) están precedidos por un guión en lugar de un signo +, para indicar que estos campos pueden estar en blanco. Los cuadros 141.3, 142.3, 143.3 de la base datos estándar 133 pueden enlazarse o por contrario interconectarse utilizando uno o más campos clave, en una forma conocida en la técnica de las bases relaciónales. Similarmente, la base datos estándar 133 pueden enlazarse o por el contrario interconectarse con la base datos portador 132 y la base datos postal 131. Los datos almacenados en la base datos estándar 133 se puede utilizar en un procedimiento conocido como comparación confusa o imprecisa. La comparación literal requiere de una comparación exacta, tal como Acmé contra Acmé. La comparación imprecisa revela comparaciones parciales, tales como Acmé, ACM, AFMED, y Ch2Acme. Los datos alias generalmente pueden ser útiles en un sistema en donde la comparación confusa es permitida o deseada, debido a que los alias por su naturaleza contienen diferencias sutiles que representan el mismo objeto. Los alias de destinatarios explicados anteriormente, por ejemplo, (Acmé Shoe Corporation, Acmé Shoes, Acmé) también representan comparaciones confusas una de la otra. La comparación confusa puede ser útil en el contexto de la estandarización de direcciones porque la representación subjetiva 80 de una dirección puede incluir uno o más artefactos de dirección ambiguos o incorrectos. Por ejemplo, la representación subjetiva 80 "Doe, 123 East Main Street N.W., Suite A-4, Atl 30030" esta incompleta e incluye varias ambigüedades. La dirección "Doe" puede compararse con un destinatario preferido "John W. Doe" a través del proceso de comparación confusa, utilizando datos almacenados en el cuadro de alias de destinatario 143.3 de la base datos estándar 131. Este ejemplo puede ilustrar como las bases datos 31-134 de supergrupo de direcciones 130 trabajan juntas, debido que las bases datos estándar 131 no pueden incluir ningún dato preferido en el cuadro 141 .3. Por consiguiente, para completar la validación de dirección 320, el sistema de administración de direcciones 1 10 puede configurar para acceder los datos relacionados en los cuadros almacenados en otras bases de datos 131 , 132, 134 con el fin de encontrar una representación preferida 90 para la dirección. Debido que los cuadros 141 , 142, 743 están enlazados, la búsqueda de una comparación puede utilizar el CP. "30030" sólo o junto con la calle principal "Main" con el fin de encontrar registros similares a la representación subjetiva 80. En este aspecto, el sistema para la administración de direcciones 110 de la presente invención en una modalidad se puede configurar para incluir programas o un lenguaje de consulta estructurado para encontrar una coincidencia entre cualquiera de los datos almacenados en el supergrupo de direcciones 130. Otra herramienta que puede ser útil en el contexto de la estandarización de direcciones y la validación se conoce como Soundex. Soundex provee un método para encontrar palabras que suenan similares. Soundex inicia con un sistema de archivo y utiliza un algoritmo fonético simple para reducir los nombres propios y otras palabras en códigos alfanumérlcos de 4 caracteres. En un tipo de algoritmo Soundex, la primera letra del código puede corresponder a la primera letra de una palabra un nombre propio, y al resto del código puede consistir de tres dígitos derivados del sonido de las sílabas restantes. En esta forma, el sonido fonético de una palabra un nombre se cuantifica. La función de Soundex es útil porque las computadoras generalmente son mejores en la comparación de números en la comparación de letras. En una modalidad, el paso de validación 720 de la presente invención puede incluir un algoritmo Soundex. La Base datos de plan 134 en una modalidad puede incluir los datos capturados, incluyendo una o más presentaciones subjetivas 80. En este aspecto, el procedimiento para agregar los datos de la representación subjetiva en el cuadro de plan 141.4, 142.4, 143.4 puede involucrar los pasos de capturar, analizar, y estandarizar descritos aquí. Por lo que los datos capturados pueden ser apropiadamente divididos y estandarizados en preparación para la validación. En una modalidad, los datos capturados se pueden almacenar principalmente en un cuadro preferido de plan 141.4. Debido a que la base datos de plan 134 es generalmente de datos capturados, puede o no puede incluir cualquier dato en los cuadros de alias de dirección y de destinatario 142.4, 143.4. Los campos de datos para estos cuadros están precedidos por un guión en lugar de un signo +, para indicar que estos campos pueden estar en blanco. 5.4.1. Organización de datos mediante jerarquía En un aspecto, el sistema para la administración de direcciones 1 10 de la presente invención toma ventaja de la naturaleza jerárquica de los datos de direcciones con el fin de rápida y eficientemente localizar los registros similares a la representación subjetiva 80. En este aspecto, el sistema para la administración de direcciones 110 puede incluir un método para preparar u organizar los datos almacenados de acuerdo con esta jerarquía inherente. Los datos de pueden organizar en series de niveles, descritos más adelante, de general a específico o en cualquier orden particularmente adecuado para la aplicación. En uso, el sistema para la administración de direcciones 1 0 se puede configurar para incluir programas o almacenar procedimientos de consulta capaces de encontrar una 3 coincidencia entre cualquiera de los datos almacenados en el supergrupo de direcciones 130. En general, una consulta se puede utilizar para extraer los datos deseados de una base datos, sin cambiar o alterar en los datos en sí. Debido que las consultas generalmente encuentran y despliegan los datos deseados a un usuario, el resultado de una consulta algunas veces es referido como una vista. También, una consulta se puede utilizar para crear un resultado (una vista) sin desplegarla al usuario. En este aspecto, una consulta se puede utilizar para organizar datos (usualmente temporalmente) en una nueva estructura que es diferente del estructurado el cuadro. Una consulta se puede utilizar para crear una nueva estructura de datos que tiene ventajas particulares, tales como una lógica mejorada en la configuración, clasificación y búsqueda más rápidas, o mover un campo de datos particular a una posición más primaria, por ejemplo. El paso de validación 320 de la presente invención en una modalidad puede incluir una o más consultas para organizar los datos en el supergrupo. Una de dichas organizaciones involucra un procedimiento llamado para generación de aviso. 5.4.2. Generación de aviso Un ejemplo de un cuadro preferido postal 141.1 se describe la Figura 9. Cada fila representa un registro individual e incluye múltiples campos. Cada campo separado se almacena en una columna separada conteniendo atributos similares. Los atributos de cuadro se muestran a través de la parte superior como los nombres de columna. El cuadro preferido 141.1 mostrado en la Figura 9, se puede escribir, teniendo el esquema (CP., Nota, Calle, Tipo, Bajo, Alto, Non/Par, Destinatario, Sec, Alto, Bajo, +4). La columna de notas como se muestra incluye una nota postal 71 como un identificador único para cada dirección única. Observar, que los registros que contienen la dirección "440 First Street, Suite 600" han sido asignados a la nota postal T6. Los otros registros de calle en otras filas del cuadro representan diferentes direcciones, y por consiguiente tiene diferentes notas. Los datos de dirección por naturaleza son jerárquicos. Los varios artefactos de una dirección varían de general a específico. Por ejemplo, el CP. de cinco dígitos por sí mismo provee un día general de una ubicación de una dirección, mientras una dirección completa normalmente se entiende, incluyendo el residente o destinatario y todos los datos de la calle así como el CP. o el CP. + 4 provee un una ubicación de la dirección específica. En una modalidad, el paso de validación 320 de la presente invención puede incluir una consulta o algoritmo para colocar la combinación Ciudad-Estado-C.P. en la parte superior de una jerarquía de datos de direcciones. Las combinaciones Ciudad-Estado, por supuesto, pueden incluir múltiples códigos postales. En el siguiente nivel de especificidad están los artefactos de calles, incluyendo un pre-direccional, nombre de calle, tipo de calle, y pos-direccional. Dicha dirección de calle puede verse como 100 East Main Street, SW. Los artefactos de calle se pueden además dividir utilizando una o más escalas de direcciones de calle que pueden ser puramente numéricas según la escala de 240-298 o pueden ser alfanuméricas dependiendo del campo de escala. Más allá de los artefactos de los artefactos de calle están los artefactos secundarios que incluyen un secundario y un nombre, tal como Suite 100 o DepartramentolC. Los cuatro dígitos adicionales en un CP. + 4 pueden proveer aún otro nivel de especificidad. Algunas bases datos también pueden incluir un número de secuencia de distribución de dos dígitos adicionales. El paso de validación 320 de la presente invención, en una modalidad, puede incluir un método para obtener registros en un cuadro de un supergrupo en una estructura jerárquica, de general a específica. Las relaciones y agrupación resultante de los registros se pueden definir dentro del paso de validación 320 en términos de los conceptos conocidos como de contención e inclusión. Sea asignado un número de nodo a cada registro del cuadro 141.1 , como se muestra la Figura 9. Los números de nodo pueden ayudar a demostrar los conceptos de contención e inclusión entre los registros de direcciones. 5.4.3. Niveles de contención Después de que paso de validación 320 ha reordenado los registros del 141.1 , la nueva organización jerárquica de los registros se puede ilustrar como se muestra la Figura 10. Los números de nodo en la Figura 10 se distribuyen de acuerdo con el nivel de especificidad desplegaron los datos.
Por ejemplo, el Nivel 1 en la Figura 10 incluye el Nodo 1 , que representa el registro incluyendo la escala de dirección "440 - 498" First Street". De todos los registros mostrados en la Figura 9, el registro localizado en el Nodo 1 es el más general, y por lo tanto se coloca en el Nivel 1. El siguiente nivel de especificidad, Nivel 2, incluye el Nodo 2. El registro en el Nodo 2 incluye una sola dirección de calle (440 First Street) pero no los artefactos secundarios (ningún número de departamento). El Nivel 3 en la Figura 10 incluye aquellos direcciones con los números de departamento o escalas, pero no el nombre del destinatario. Estos registros incluyen los Nodos 3, 1 1 , 4, 2, 5, y 13. Los nodos en el Nivel 3 están organizados de izquierda a derecha en el orden del número de departamento en incremento. En este aspecto, el sistema 10 se puede configurar para ordenar los datos de direcciones de izquierda a derecha además de colocarlos en diferentes niveles de especificidad. El Nivel 4 incluye aquellos registros que tienen un nombre en el campo del destinatario. Los conceptos de contención e inclusión se demuestran a través de las conexiones entre los varios nodos en la Figura 10. El Nodo 10 está conectado con el Nodo 3 porque el "Departamento 3" es un subgrupo en la escala del "Departamento 00 - 400". Similarmente, los Nodos 6, 7 y 8 están conectados al Nodo 5 porque sus números de departamento "500 y 600" son un subgrupo de la escala en el Nodo 5 (Departamento 500 - 600). Finalmente, el Nodo 9 es un subgrupo del Nodo 13 porque la dirección es la misma, pero el Nodo 9 incluye un nombre de destinatario. Los nodos como se muestra en la Figura 10 ilustran los conceptos de contención e inclusión que pueden imponerse en una modalidad del paso de validación 320 de la presente invención. El Nodo 1 en el Nivel 1 "contiene" todos los nodos debajo de el, porque todos los otros registros de direcciones caen dentro de la escala manifestada por el Nodo 1. Inversamente, todos los nodos debajo del Nivel 1 están "incluidos" dentro (o contenidos por el Nodo 1. Similarmente, el Nodo 2 en el Nivel 2 contiene todos los nodos debajo de él, y el Nodo 3 contiene el Nodo 0. En Nodo 5 contiene los Nodos 8, 6, y 7 porque son subgrupos de la escala manifestada en el Nodo 4. El Nodo 13 contiene el Nodo 9. En una modalidad, el paso de validación 320 de la presente invención puede asignar una nota a un registro único. Las notas también demuestran los conceptos de contención e inclusión. La Figura 11 es una representación tabular del cuadro de jerarquía ¡lustrado en la Figura 10. El cuadro de la Figura 11 muestra todos los nodos y notas en cada nivel, empezando con el Nivel 1. La nota T1 se puede describir como conteniendo todas las otras notas en el cuadro jerárquico. Observar, sin embargo, que los números de notas pueden ser diferentes de los números de nodo. La nota T3 contiene la nota T9. La nota T5 contiene las notas T6 y 17. Observar que la nota T6 se utiliza para ambos Nodos 6 y 7 porque las direcciones son equivalentes.
Los conceptos de inclusión y contención pueden fácilmente ser vistos en la Figura 11. Por ejemplo, al comparar los datos del Nodo 13 y Nodo 10, el lector puede observar que "Departamento 310" en el Nodo 10 yace entre el escala de los números de departamento (100-400) almacenado en el Nodo 3. Esta relación demuestra los conceptos de inclusión y contención esta 10 ilustran la Figura 0. En una modalidad, no existe un límite en el número de niveles de contención que se pueden aplicar durante el paso de validación 320 de la presente invención. Un registro de dirección puede contener un gran número de artefactos. Un cuadro puede incluir un gran número de registros. Considerando el vasto número de registros que se pueden incluir un cuadro, la organización jerárquica de los registros se puede utilizar para en gran medida incrementar la velocidad de acceso y análisis de los datos. Los niveles de contención y los números de notas descritos para los 13 nodos ilustrados las Figuras 14, 15, 16 se pueden aplicar a millones de registros de direcciones y escalas, en cualquiera de los cuadros de un supergrupo de direcciones 130. En la misma forma, el cuadro preferido 141.1 en la Figura 9 se puede ordenar de acuerdo con la jerarquía, los otros cuadros 141 , 142, 143 en el supergrupo de direcciones 130 también se puede organizar utilizando los nodos y los niveles de contención. Además de la reorganización de los datos utilizando niveles de contención, cada cuadro se puede transformar en una lista enlazada de matriz escasa, como se describió aquí, para además incrementar la velocidad de procesamiento. 5.4.3. Generaciones de aviso preferidas Haciendo referencia a través de los cuadros 141.1 en la Figura 9, a ambos Nodos 6 y 7 se les dio una nota T6 idéntica porque representan la misma ubicación física. Observar, los nombres de destinatario en los Nodos 6 y 7 son "APC" y "AM AGRUPAMIENTO CMTE", respectivamente. Estos nombres alternativos para las direcciones son alias de destinatarios. En otras palabras, APC es un alias para AM AGRUPAMIENTO CMTE. Como se explicó aquí, dicho alias del destinatario se puede almacenar en uno o más cuadros de alias destinatario 143 en el supergrupo de direcciones 130. Similarmente, los datos de alias de calle se pueden almacenar en uno o más cuadros de alias de calle 142 del supergrupo de direcciones 30. Los campos en el cuadro de alias de calle 142, por ejemplo, se pueden organizar como se muestra Figura 13. El cuadro de alias de calle de ejemplo 142 en la Figura 13 puede incluir varios alias de calle para Sexta Avenida en la Ciudad de Nueva York, las cuales también conocida como la Avenida de las Américas. Un cuadro de alias de calle 142 puede incluir dicha lista en un formato que fácilmente accesible cuando se compara con los registros de direcciones de calles. En un aspecto de la presente invención, el sistema para la administración de la base de datos de direcciones 10 puede ser instruido para notar una de las representaciones alias como la "representación preferida". Al aplicar los varios alias de calle y alias de destinatarios a los datos almacenados en el supergrupo de datos direcciones 130, una de las notas T4081 (por ejemplo) se puede notar como la representación preferida. Como tal la nota preferida 70 puede incluir una nota tal como una "p" para preferido, de tal forma que la nota preferida 70 puede verse, T4081p. El sistema 10 de la presente invención puede reconocer que todos los registros de direcciones con la nota T4081 son equivalentes. En una modalidad, la identificación de una nota preferida 70 y la notación de esta (T4081 p, por ejemplo) puede ser útil para asegurar los artefactos preferidos (notados T4081 p) de una dirección de calle particular siempre regresan en respuesta a una consulta. En este aspecto de la invención, un paso de validación 320 en una modalidad se puede configurar para organizar los datos almacenados en una nueva estructura de datos jerárquica utilizando consultas. Una o más de las notas se pueden notar por el contrario identificar como una nota preferida 70 en una modalidad con el fin de identificar la representación preferida de una dirección o de un artefacto particular. En un aspecto relacionado, el sistema de administración de la presente invención se puede configurar para pasar notas (en lugar de texto) entre varios componentes del sistema 10 de la presente invención. El intercambio de notas puede ser más eficiente y menos propenso errores el intercambio de grandes cadenas de texto dirección. En este aspecto, el uso de notas como identificadores únicos además acelera el procesamiento de las consultas, reportes y otros tipos de análisis sobre los datos almacenados en un supergrupo. En una modalidad, el paso de validación 320 se puede ejecutar como parte de un paquete de programas 500 del sistema de administración de direcciones 110 (del Figura 7, por ejemplo). El paso de validación 320 se puede llevar a cabo en un supergrupo duplicador 330 y da como resultado la edición del cliente AMS 655. En un sistema para administración de direcciones 110 la aplicación de una o más de las técnicas descritas aquí, el tiempo transcurrido desde el paso de captura 300 al paso de edición 395 pueden estar en la escala de 100 a 200 milisegundos. 5.4.5. Comparación El paso de validación 320 en una modalidad generalmente incluye comparar una representación subjetiva 80 con los valores almacenados en los cuadros en el supergrupo 30 y por lo tanto buscar una representación preferida 90. En el contexto de un sistema de administración de direcciones 1 10, la validación de las direcciones 320 generalmente involucra la comparación de la representación subjetiva 80 de una dirección capturada con los valores almacenados en las bases de datos de direcciones 131 , 132, 133 en un supergrupo de direcciones 130 (como se muestra Figura 1 ), e identificar la representación preferida 90 para las direcciones. En el diagrama de bloque mostrado la Figura 12, el paso de validación de 320 ocupa un solo bloque. Como se describió aquí, sin embargo, el paso de validación de 120 puede involucrar un gran número de pasos y procedimientos para validar una dirección. Las secciones precedentes han subrayado un número de rutinas para manipulación de datos y métodos de búsqueda, mientras el procedimiento para comparar los datos capturados a los datos almacenados se describe generalmente. Más específicamente, el procedimiento de comparación del paso de validación 320 en una modalidad puede incluir los pasos numerados listados continuación. (1) Almacenar los datos capturados (representaciones subjetivas 80) en la base de datos de plano 134, en el cuadro preferido 141.4 (referido como Figura 1 ). (2) Comparar los datos capturados almacenados en el cuadro preferido 141.4 con los valores de los datos almacenados en los otros cuadros preferidos 141.1 , 141.2 y 141.3 (si existe alguno). Recordar, que en una modalidad, cada cuadro en el supergrupo puede haber sido transformado en una lista enlazada de matriz escasa, re-organizarse utilizando nodos y niveles de contención jerárquicos, y/o generación de avisos como se describió anteriormente, para facilitar una rápida y eficiente búsqueda en cada cuadro. El procedimiento de comparación puede incluir localizar una o más representaciones candidato de entre los valores de datos almacenados en los otros cuadros preferidos 141.1 , 141.2, 141.1. El encontrar una coincidencia incluye, en general, seleccionar la representación candidato que tiene el parecido más cercano a la representación selectiva 80 está buscando. (a) Si se encuentra una coincidencia entre los datos capturados y los datos del cuadro preferido, entonces localizar la nota preferida correspondiente 70 y proceder a ejecutar los pasos de actualización 380, combinación 390, y edición 395 mostrados en la Figura 12. (b) Si no se encuentra ninguna coincidencia, seguir al paso siguiente (a). (3) Comparar los datos capturados del nombre de la calle almacenados en el cuadro preferido 141.4 con los valores de los datos alias de la calle almacenados en los cuadros alias de calle 142.1 , 142.2 y 142.3. El procedimiento para comparar puede incluir localizar uno o más alias de calle candidato de entre los valores de los datos almacenados en los cuadros alias de calle 141.2, 142.2, 142.3. El encontrar una coincidencia puede incluir, en general, seleccionar el alias de calle candidato más cercanamente asociado con una nota preferida. (a) Si se encuentra una coincidencia entre los datos capturados del nombre de la calle y los datos del cuadro alias de calle, entonces localizar la nota preferida 70 identificando el alias de la calle preferida, sustituir el alias de calle correspondiente por el nombre de la calle en el cuadro preferido 141.4 y utilizar el paso de repetición de alias de calle (1 ) anterior. (b) Si no se encuentra ninguna coincidencia, proseguir al paso (4) cliente. (4) Comparar los datos capturados del nombre del destinatario almacenado en el cuadro preferido centro 41.4 con los valores de los datos alias de destinatario almacenados en los cuadros alias de destinatarios 143.1 (si hay alguno), 143.2 y 143.3. El procedimiento de comparar puede incluir localizar uno o más alias de destinatario candidato de entre los valores de los datos almacenados en los cuadros alias destinatarios 143.1 , 143.2 y 143.3. Encontrar una coincidencia puede incluir, en general, seleccionar los alias destinatarios candidatos más estrechamente asociados con una nota preferida. (a) Si se encuentra una coincidencia entre los datos capturados del nombre del destinatario y los datos del cuadro alias del destinatario, entonces localizar la nota preferida 70 identificando el alias del destinatario preferido, sustituir el alias de destinatario correspondiente por el nombre del destinatario en el cuadro preferido 141.4, y utilizar el paso de repetición del alias del destinatario (1 ) anterior. (b) Si no se encuentra ninguna coincidencia, proseguir al paso (5). (5) Regresar un código de excepción 400 al usuario 28 o a la aplicación. (6) En una modalidad, el paso de validación 3 120 puede incluir paso de desplegar una lista de posibles coincidencias (direcciones, alias de calle, alias destinatarios) y permitir al usuario 28 ejecutar una comparación visual y una selección manual (si es apropiado) de una de las posibles coincidencias según la representación preferida. (a) Si se hace una selección manual, el procedimiento de comparación podría proseguir a ejecutar los pasos de actualización 380, combinar 390, y editar 395 mostrados en la Figura 12. (b) Si no se hace ninguna selección manual, los datos capturados y el código de excepción 400 se pueden transferir fuera del sistema de validación para un procesamiento adicional. El método descrito en el Paso (2) anterior, para encontrar una representación de dirección preferida, puede incluir los pasos adicionales de (a) analiza la representación subjetiva en uno o más artefactos distintos; (b) seleccionar uno de los uno o más artefactos distintos: (1 ) localizar uno o más artefactos candidato de entre los datos fuente a través de la comparación de un artefactos distinto con los datos fuente; (2) seleccionar un artefacto preferidos de entre el uno o más artefactos candidato, el artefactos preferidos teniendo el parecido más cercano al artefacto diferente; (3) clasificar el artefacto preferido; (c) repetir el paso (b) para cada uno de los uno o más artefactos distintos; (d) caminar los artefactos preferidos para formar una representación preferida.
Similarmente, el método descrito en los Pasos (3) y (4) anteriores, para encontrar una representación alias preferida, puede incluir los pasos adicionales de (a) analizar la representación subjetiva en uno o más artefactos distintos; (b) seleccionar uno de los uno o más artefactos distintos; (1 ) localizar uno o más artefactos alias candidato de entre los datos fuente a través de la comparación de un artefactos distinto con los datos alias; (2) seleccionar un artefacto alias preferidos de entre el uno o más artefactos alias candidato, el artefacto alias preferidos estando más cercanamente asociado con la nota al es preferido; (3) clasificar el artefacto alias preferido; (c) repetir el paso (b) para cada uno de los uno o más artefactos distintos; (d) agrega el artefacto alias preferido a los alias preferidos. El término "coincidencia" como se utiliza en los pasos de comparación descritos anteriormente, en una modalidad, puede involucrar un análisis de uno o más artefactos de una dirección con el fin de determinar si las similitudes entre los datos son suficientemente válidas para constituir una "coincidencia". Por ejemplo, se pueden aplicar las siguientes días: 1. Una comparación literal se requiere en la dirección primaria, la cual incluye el número de calle y nombre de la calle. 2. Una comparación literal solamente es requerida en el secundario (tal como número del departamento) cuando el secundario existe en la Base de datos de portador 132 y está asociado con la dirección primaria. 3. Una comparación literal solamente se requiere en el nombre de destinatario cuando el destinatario existe en la Bases datos del plan 134 (los datos capturados). Se deberá entender que se pueden establecer otras de guías de comparación, dependiendo de los objetivos de la aplicación del procesamiento. 5.5 Interfaz En una modalidad, el sistema para la administración de la base de datos 110, de la presente invención puede incluir una interfaz 600 y un paquete de programas 500, como se muestra en las Figuras 3 y 5-9, una interfaz 600 en una modalidad puede ser un programa de computadora diseñado para proveer una conexión operativa o interfaz entre una aplicación (tal como un paquete de programas 500) y un usuario (u otra aplicación). Una interfaz 600 puede proveer una serie de comandos que le permiten un usuario crear, leer, actualizar, y eliminar los valores de los datos almacenados en los cuadros de la bases datos. Estas funciones (crear, leer, actualizar, eliminar) algunas veces son referidas utilizando el acrónimo CRUD, por lo que una interfaz que provee esos comandos puede ser denominada una interfaz CRUD. Una interfaz de la base de datos que incluye una función de consulta puede ser denominada una interfaz CRUDQ. En una modalidad, la interfaz 600 por está configurada como una interfaz basada en COM; significando que está basada en el Modelo del Objeto del Componente. El Modelo del Objeto de Componente es una arquitectura de software abierta que puede facilitar la interoperabilidad entre una interfaz 600 y varios otros componentes del sistema 10 de la presente invención. Aunque una interfaz 600 basada en COM puede ser provista, se pueden utilizar otros modelos de software que logren una funcionalidad deseada. Una función de consulta se puede incluir en una interfaz 600 de acuerdo con una modalidad de la presente invención. Una consulta es un comando o instrucción utilizado para extraer un grupo de datos deseado de una base de datos. El lenguaje de consulta mejor conocido es el Lenguaje de Consulta Estructurada (SQL, que se pronuncia "esecuele"), aunque se puede utilizar otros lenguajes de consulta. Una consulta puede incluir su no sólo comando o series de comandos complejas. SQL incluye una amplia variedad de comandos de consulta. Los grupos de comandos de consulta que se pueden utilizar otra vez se pueden guardar en SQL como un procedimiento almacenado. Como correr un programa, llamaron procedimiento almacenado en SQL es más eficiente que enviar comandos de consulta individuales uno a la vez. También, los procedimientos almacenados generalmente se compilan por anticipado y también pueden guardar en memoria caché a través del sistema de administración de bases datos. En ese aspecto, los comandos de consulta se pueden utilizar como una herramienta de programación poderosa. 5.5.1. Identificador de la aplicación La interfaz 600 en una modalidad se puede configurar para operar e interactuar con una variedad diferentes programas y aplicaciones, tanto internas como externas al sistema de administración de base de datos, 1 10 en uso. La interfaz 600 se puede configurar para operar con cada componente del paquete de programas 500 interno. La interfaz 600 también se puede configurar para operar con uno o más programas aplicaciones externos, fuera del sistema de administración de base de datos, tales como las aplicaciones de base de datos relacionadas, aplicaciones de reporte oficial, aplicaciones de negocios independientes, o cualquiera de una variedad de otros programas que pueden tener un deseo o necesidad de negocios para interactuar con los datos almacenados en el supergrupo 30, 30. En una modalidad, la interfaz 600 de la presente invención puede incluir uno o más identificadores de aplicación, cada uno teniendo un grupo de reglas correspondiente. El identificador de aplicación se puede utilizar para identificar la aplicación que busca acceso al sistema de administración de bases datos de la presente invención. El identificador de aplicación puede ser un sólo comando o un algoritmo complejo. En general, el identificador de la aplicación operar identificar una aplicación que busca interactuar con la base de datos.
Cada identificador de aplicación puede incluir un grupo de reglas correspondiente que puede ser utilizado para gobernar la interacción entre una aplicación específica 270 y el sistema de administración de base de datos. Dichas interacciones pueden incluir solicitudes de consulta, actualizaciones de suscripción, transferencia de datos u otras comunicaciones, instrucciones de formato de salida, o cualquier otra conducta. Los identificadores de aplicación y los grupos de reglas se pueden almacenar en una base de datos o por el contrario guardas en un formato accesible. En el contexto de un sistema de administración de direcciones 1 10, por ejemplo, una aplicación específica 270 puede buscar acceso al supergrupo de direcciones 130 enviando una consulta. En respuesta, una interfaz 600 se puede configurar al identificar la aplicación 270, recuperar el identificador de aplicación apropiado, y a su vez recuperar el grupo de reglas correspondiente. La interfaz 600 entonces puede pasar el grupo de reglas al sistema de administración de direcciones 110 para utilizarlo en el procesamiento de la consulta u otra interacción con aplicación 270. El sistema para administración de direcciones 1 10 puede procesar consultas o tomar otras acciones relacionadas con aplicación 270 que producen los datos de salida. Los datos de salida pueden ser devueltos a la interfaz 600, en donde el grupo de reglas puede ser utilizado para confirmar que los datos salida están en un formato accesible para la aplicación 270. En ese aspecto, el sistema de administración de direcciones 110 y su interfaz 600 pueden cooperar en el procesamiento de solicitudes de aplicaciones 270 mediante el uso del grupo de reglas. En ese aspecto, la interfaz 600 de la presente invención es genética; significando que la interfaz 600 se puede configurar para operar interactuar con cualquier aplicación 270. Al mantenerse un grupo de reglas separado de la interfaz misma, la programación en la interfaz de 600 no necesita incluir reglas para todos los tipos de aplicaciones 270. Más bien, a través del uso de un identificador de aplicación, la interfaz 600 puede incluir solamente comandos relativamente simples para encontrar y recuperar grupo de reglas correspondiente. Cuando el sistema de administración 110 requiere de la interacción con una nueva aplicación 270, no existe la necesidad de modificar la interfaz 600. La única acción requerida puede ser agregar un identificador de aplicación y un grupo de reglas correspondiente para la nueva aplicación 270. La interfaz 600 puede proveer un sistema para capturar dicha no información. 5.5.2. Profundidad de la captura de los datos El grupo de reglas para un aplicación particular 270 en una modalidad se puede configurar para controlar de artefactos particulares capturar de un supergrupo de datos 30. En uso, por ejemplo, una primera aplicación puede requerir solamente los datos del CP., mientras que una segunda aplicación puede requerir el CP. + 4, Ciudad, y Estado. El grupo de reglas de la presente invención puede incluir información almacenada acerca de los requerimientos de datos para la aplicación particular 270 en uso. Al controlar la extensión o profundidad de la captura de los datos, el grupo de reglas puede incrementar la eficiencia la velocidad con la cual la interfaz 600 accede los datos dentro del sistema 10. 6. Conclusión Las modalidades descritas en la invención pretenden meramente ser ilustrativas. Numerosas variaciones y modificaciones serán evidentes para aquellos con experiencia en la técnica. Todas dichas variaciones y modificaciones pretenden caer dentro del alcance de la presente invención como se define en las reivindicaciones anexas. Lo que se ha descrito anteriormente incluye varios ejemplos. Por supuesto, no es posible describir cada combinación concebible de componentes o metodologías para propósitos de describir los sistemas, métodos, medios desfiles por computadora, etc., empleados en los sistemas de administración de base de datos. Sin embargo, uno con experiencia en la técnica puede reconocer que son posibles combinaciones y por mutaciones adicionales. Por consiguiente, esta solicitud pretende abarcar alteraciones, modificaciones y variaciones que caen dentro del alcance de las reivindicaciones anexas. Además, la descripción precedente no pretende limitar el alcance de invención. Más bien el alcance del invención se determinará solamente a través de las reivindicaciones anexas y sus equivalentes. Ya que los sistemas, métodos, y aparatos aquí han sido ilustrados a través de los ejemplos descritos, y ya que los ejemplos han sido descritos con detalle considerable, no es la intención de los solicitantes restringir o en ninguna forma limitar el alcance de las reivindicaciones anexas a dicho detalle. Las ventajas y modificaciones adicionales serán fácilmente evidentes para aquellos con experiencia clínica. Por consiguiente, la invención, en sus aspectos más amplios, no está limitada los detalles específicos, los sistemas y métodos representativos, o los ejemplos ilustrativos mostrados y descritos. Por consiguiente, se pueden hacer variaciones a partir de dichos detalles sin apartarse del espíritu o alcance de los conceptos del invención generales de la solicitud.

Claims (30)

NOVEDAD DE LA INVENCION REIVINDICACIONES
1. Un sistema de administración de base de datos (110) en un sistema para procesar datos, caracterizado porque comprende: una pluralidad de bases datos relaciónales (31-35) operativamente conectada para formar un supergrupo de datos (30), en donde cada una de dichas bases datos relaciónales (31-35) incluye uno o más cuadros para almacenar dichos datos, y en donde cada uno de dichos uno o más cuadros comparten una estructura de datos común; y uno o más módulos de programa de computadora (500) configurados para: capturar una representación subjetiva (80) y almacenarla en una primera de dichas bases relaciónales (31-35); almacenar los datos fuente en una segunda de dichas bases relaciónales (31 -35), dichos datos fuente comprenden representaciones generales de un tipo similar a dicha representación subjetiva (80); localizar una o más representaciones candidato de entre dichos datos fuente a través de la comparación de dicha representación subjetiva (80) con dichos datos fuente; y seleccionar una representación preferida (90) de entre dichas una o más aceptaciones candidato, que tienen el parecido más cercano con dicha representación subjetiva (80).
2. El sistema para administración de base de datos (110) de conformidad con la reivindicación 1 , caracterizado además porque dichos uno o más módulos de programa de computadora (500) está configurado para almacenar dichos uno o más cuadros como una lista enlazada de matriz escasa.
3. El sistema para administración de base de datos (110) de conformidad con la reivindicación 1 , caracterizado además porque dichos uno o más módulos de programa de computadora (500) está configurado para transformar dicho uno o más cuadros en una lista enlazada de matriz escasa.
4. El sistema para administración de base de datos ( 10) de conformidad con la reivindicación 1 , caracterizado además porque dicha representación subjetiva (80) describe una dirección y dichos datos fuente comprenden registro de dirección.
5. El sistema para administración de base de datos (110) de conformidad con la reivindicación 1 , caracterizado además porque dichos uno o más módulos de programa de computadora (500) están configurados para: asignar una nota preferida (70) a dicha representación preferida (90); y reconocer dicha nota preferida (70) si está presente entre cualquiera de dichas una o más representaciones candidato.
6. El sistema para administración de base de datos (110) de conformidad con la reivindicación 1 , caracterizado además porque cada uno de dichos uno o más cuadros incluye una pluralidad registros, y en donde dicho uno o más módulos de programa de computadora (500) además está configurado para: organizar dichos registros en un orden jerárquico, en series de niveles de general a específico, con base en los valores de dichos datos almacenados en dichos registros; y transformar uno o más de dichos cuadros en una lista enlazada de matriz escasa.
7. El sistema para administración de base de datos (110) de conformidad con la reivindicación 6, caracterizado además porque un sistema comprende una computadora servidor local (510, 200) y una o más computadoras cliente distantes (655, 255), en donde dicho uno o más módulos de programa de computadora (500) además está configurado para: distribuir un duplicado de dicha lista enlazada de matriz escasa desde dicha computadora servidor local (510, 200) ha dicha una o más computadoras cliente distantes (655, 255).
8. El sistema para administración de base de datos (110) de conformidad con la reivindicación 1 , caracterizado además porque dicho uno o más módulos de programa de computadora (500) además está configurado para: (a) analizar la representación subjetiva (80) en uno o más artefactos diferentes; (b) seleccionar uno de los uno o más artefactos diferentes: (1 ) localizar uno o más artefactos candidatos de entre dichos datos fuente a través de la comparación del artefacto diferente con dichos datos fuente; (2) seleccionar un artefacto preferido de entre dichos uno o más artefactos candidato que tienen un parecido más cercano con dichos artefacto diferente; (3) almacenar dicho artefacto preferido; (c) repetir el paso (b) para cada uno de dichos uno o más artefactos diferentes; y (d) combinar dichos artefactos preferidos para formar una de dichas una o más representaciones preferidas.
9. El sistema para administración de base de datos (1 10) de conformidad con la reivindicación 8, caracterizado además porque dicho uno o más módulos de programa de computadora (500), además está configurado para: almacenar los datos de estandarización en una tercera de dichas bases de datos relaciónales (31-35), dichos datos de estandarización comprenden una o más representaciones estandarizadas de dichos uno o más artefactos distintos.
10. El sistema para administración de base de datos (1 10) de conformidad con la reivindicación 1 , caracterizado además porque dichos uno o más módulos de programa de computadora (500) además está configurado para: almacenar datos alias en una cuarta de dichas bases de datos relaciónales (31-35); revisar dichos datos alias para identificar uno o más registros alias seleccionados que contienen una representación alias preferida; agregar una nota de alias preferida ha dicho uno o más registros alias seleccionados; localizar uno o más alias candidato de entre dichos datos alias a través de la comparación de dicha representación subjetiva (80) con dichos datos alias; y seleccionar un alias preferido de entre dichos uno o más alias candidato, dichos alias preferidos son los más cercanamente asociados con dicho aviso alias preferido.
11. El sistema para administración de base de datos (110) de conformidad con la reivindicación 10, caracterizado además porque dicho uno o más módulos de programa de computadora (500) además está configurado para: (a) analizar dicha representación subjetiva (80) en uno o más artefactos diferentes; (b) seleccionar uno de dichos uno o más artefactos diferentes: (1 ) localizar uno o más artefactos candidatos de entre dichos datos fuente comparando dicho artefacto diferente con dichos datos fuente; (2) seleccionar un artefacto preferido de entre dichos uno o más artefactos candidato, dicho artefacto preferido tiene un parecido más cercano con dicho artefacto diferente; (3) almacenar dicho artefacto preferido; (c) repetir el paso (b) para cada uno dichos uno o más artefactos diferentes; y (d) combina dichos artefactos preferidos para formar una de dichas una o más representaciones candidato.
12. El sistema para administración de base de datos (1 0) de conformidad con la reivindicación 1 , caracterizado además porque dicho uno o más módulos de programa de computadora (500) está configurado para: analizar dicha representación subjetiva (80) en uno o más artefactos distintos; almacenar los datos de estandarización en una tercera de dichas bases de datos relaciónales (31-35), dichos datos de estandarización comprenden una o más representaciones estandarizadas de dichos uno o más artefactos distintos; y almacenar los datos alias en una cuarta de dichas bases de datos relacionales(31-35), dichos datos alias comprenden una pluralidad de representaciones equivalentes de dichos uno o más artefactos distintos.
13. El sistema para administración de base de datos (1 0) de conformidad con la reivindicación 1 , en un sistema que además comprende una o más aplicaciones extemas, caracterizado además porque dicho sistema de administración de base de datos (110) además comprende: una interfaz aplicación (600) configurado para gobernar la interacción entre dichos uno o más módulos de programa de computadora (500) y dicha una o más aplicaciones externas.
14. El sistema para administración de base de datos (1 10) de conformidad con la reivindicación , en un sistema que además comprende una o más aplicaciones externas, caracterizado además porque dicho uno o más módulos de programa de computadora (500) está configurado para: almacenar una pluralidad de grupos reglas, cada uno correlacionado con una de dichas una o más aplicaciones externas; recibir una solicitud de una primera aplicación externa; recuperar un primer grupos reglas correlacionado con dicha primera aplicación extema; y aplicar dicho primer grupos reglas para gobernar la interacción entre dicha primera aplicación externa y dichos uno o más módulos de programa de computadora (500).
15. El sistema para administración de base de datos ( 10) de conformidad con la reivindicación 1 , caracterizado además porque dicho primer grupos reglas incluye una lista de datos disponibles para captura a partir de dicho supergrupo (30) de bases de datos relaciónales (31 -35) para uso a través de dicha primera aplicación externa.
16. Un método para utilizar una o más bases de datos para procesar una representación subjetiva (80) en un sistema para procesar datos, dicho método está caracterizado por los pasos de: proveer una pluralidad de bases de datos relaciónales (31-35) operativamente conectadas para formar un supergrupo de datos (30), en donde cada una de dichas bases relaciónales (31-35) incluye uno o más cuadros para clasificar dichos datos, y en donde cada uno de dichos uno o más cuadros comparten una estructura de datos común; capturar (300) una representación subjetiva (80) y almacenarla en una primera de una de dichas bases relaciónales (31-35); almacenar los datos fuentes en una segunda de dichas bases relaciónales (31 -35), dichos datos fuente comprenden representaciones generales de un tipo similar a dicha representación subjetiva (80); localizar una o más sensaciones candidato de entre dichos datos fuente a través de la comparación de dicha representación subjetiva (80) con dichos datos fuente; y seleccionar una representación preferida (90) de entre dichas una o más representaciones candidato, dicha representación preferida (90) tiene un parecido más cercano con dicha representación subjetiva (80).
17. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionalmente: almacenar dicho uno o más cuadros como una lista enlazada de matriz escasa.
18. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionalmente: transformar dicho uno o más cuadros en una lista enlazada de matriz escasa.
19. El método de conformidad con la reivindicación 16, caracterizado además porque dicha representación subjetiva (80) describe una dirección y dichos datos fuente comprenden registro de direcciones.
20. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionalmente: asignar un aviso preferido (70) a dicha representación preferida (90); y reconocer dicho aviso preferido (70) si está presente entre cualquiera de dichas una o más representaciones candidato.
21. El método de conformidad con la reivindicación 16, caracterizado además porque cada uno de dichos uno o más cuadros incluye una pluralidad de registros, dicho método además comprende: organizar dichos registros en un orden jerárquico, en una serie de niveles de general a específico, con base en los valores de dichos datos almacenado en dichos registros; y transformar uno o más de dichos cuadros en una lista enlazada de matriz escasa.
22. El método de conformidad con la reivindicación 21 , caracterizado además porque un sistema comprende una computadora servidor local (510, 200) y una o más computadoras clientes distantes (655, 255), dicho método además comprende: distribuir un duplicado de dicha lista enlazada de matriz escasa de dicha computadora servidor local (510, 200) ha dicha una o más computadoras clientes distantes (655, 255).
23. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionaimente: (a) analizar (305) dicha representación subjetiva (80) en uno o más artefactos diferentes; (b) seleccionar uno de dichos uno o más artefactos diferentes: (1 ) localizar uno o más artefactos candidatos de entre dichos datos fuente comparando dicho artefacto diferente con dichos datos fuente; (2) seleccionar un artefacto preferido de entre dichos uno o más artefactos candidato, dicho artefacto preferido tiene un parecido más cercano con dicho artefacto diferente; (3) almacenar dicho artefacto preferido; (c) repetir el paso (b) para cada uno dichos uno o más artefactos diferentes; y (d) combina dichos artefactos preferidos para formar una de dichas una o más representaciones candidato.
24. El método de conformidad con la reivindicación 23, caracterizado además porque comprende adicionalmente: almacenar los datos estandarización en una tercera de dichas bases de datos relaciónales (31-35), dichos datos estandarización comprenden una o más de dichas representaciones estandarizadas de dichos uno o más artefactos distintos.
25. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionalmente: almacenar datos alias en una cuarta de dichas bases de datos relaciónales (31 -35); revisar dichos datos alias para identificar uno o más registros alias seleccionados que contienen una representación alias preferida; agregar un aviso alias preferido a dichos uno o más registros alias seleccionados; localizar uno o más alias candidato de entre dichos datos alias a través de la comparación de la representación subjetiva (80) con dichos datos alias; y seleccionar un alias preferido de entre dichos uno o más alias candidato, dichos alias preferidos están más cercanamente asociados con dicho aviso de alias preferido.
26. El método de conformidad con la reivindicación 25, caracterizado además porque comprende adicionalmente: (a) analizar (305) dicha representación subjetiva (80) en uno o más artefactos diferentes; (b) seleccionar uno de dichos uno o más artefactos diferentes: (1 ) localizar uno o más artefactos candidatos de entre dichos datos fuente comparando dicho artefacto diferente con dichos datos fuente; (2) seleccionar un artefacto preferido de entre dichos uno o más artefactos candidato, dicho artefacto preferido tiene un parecido más cercano con dicho artefacto diferente; (3) almacenar dicho artefacto preferido; (c) repetir el paso (b) para cada uno dichos uno o más artefactos diferentes; y (d) combina dichos artefactos preferidos para formar una de dichas una o más representaciones candidato.
27. El método de conformidad con la reivindicación 16, caracterizado además porque comprende adicionalmente: analizar (305) dicha representación subjetiva (80) en uno o más artefactos distintos; almacenar los datos estandarización en una tercera de dichas bases de datos relaciónales (31-35), dichos datos estandarización comprenden una o más de dichas representaciones estandarizadas de dichos uno o más artefactos distintos y clasificar los datos alias en una cuarta de dichas bases de datos relaciónales (31-35), dichos datos alias comprenden una pluralidad de representaciones equivalentes de dichos uno o más artefactos distintos.
28. El método de conformidad con la reivindicación 16, en un sistema que además comprende una o más aplicaciones externas, dicho método caracterizado además porque comprende adicionalmente: proveer una ¡nterfaz de aplicación (600) configurada para gobernar la interacción entre dichos uno o más módulos el programa de computadora (500) y dichas una o más aplicaciones externas.
29. El método de conformidad con la reivindicación 16, en un sistema que además comprende una o más aplicaciones externas, dicho método caracterizado además porque comprende adicionalmente: clasificar una pluralidad de grupos reglas, cada uno correlacionado con una de dichas una o más aplicaciones externas; recuperar una solicitud de una primera aplicación externa; recuperar un primer grupos reglas correlacionado con dicho primera aplicación externa; y aplicar dicho primer grupos reglas para gobernar la interacción entre dicha primera aplicación externa y dicho uno o más módulos el programa de computadora (500).
30. El método de conformidad con la reivindicación 29, caracterizado además porque dicho primer grupos reglas incluye una lista de datos disponibles para captura a partir de dicho supergrupo (30) de bases de datos relaciónales (31 -35) para uso a través de dicha primera aplicación externa.
MXPA06004481A 2003-10-21 2003-10-21 Estructura de datos y sistema de administracion para un super conjunto de bases de datos relacionales. MXPA06004481A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2003/033349 WO2005050481A1 (en) 2003-10-21 2003-10-21 Data structure and management system for a superset of relational databases

Publications (1)

Publication Number Publication Date
MXPA06004481A true MXPA06004481A (es) 2006-07-10

Family

ID=34618841

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06004481A MXPA06004481A (es) 2003-10-21 2003-10-21 Estructura de datos y sistema de administracion para un super conjunto de bases de datos relacionales.

Country Status (7)

Country Link
EP (1) EP1687741A1 (es)
JP (1) JP2007535009A (es)
CN (1) CN100421107C (es)
AU (1) AU2003284305A1 (es)
CA (1) CA2543159C (es)
MX (1) MXPA06004481A (es)
WO (1) WO2005050481A1 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7548935B2 (en) * 2002-05-09 2009-06-16 Robert Pecherer Method of recursive objects for representing hierarchies in relational database systems
CA2593851A1 (en) 2005-01-28 2006-08-10 Duane Anderson Registration and maintenance of address data for each service point in a territory
CN100367280C (zh) * 2005-11-07 2008-02-06 西安工程科技学院 互联网三维人体测量数据共享系统及数据融合方法
US8204856B2 (en) 2007-03-15 2012-06-19 Google Inc. Database replication
US7822729B2 (en) 2007-08-15 2010-10-26 International Business Machines Corporation Swapping multiple object aliases in a database system
US7788305B2 (en) * 2007-11-13 2010-08-31 Oracle International Corporation Hierarchy nodes derived based on parent/child foreign key and/or range values on parent node
WO2010121218A2 (en) * 2009-04-16 2010-10-21 Tibco Software Inc. Policy-based storage structure distribution
US8538934B2 (en) * 2011-10-28 2013-09-17 Microsoft Corporation Contextual gravitation of datasets and data services
CN103093218B (zh) * 2013-01-14 2016-04-06 西南大学 自动识别表格类型的方法及装置
US10223637B1 (en) 2013-05-30 2019-03-05 Google Llc Predicting accuracy of submitted data
CN110998542B (zh) * 2017-05-24 2023-12-29 东新软件开发株式会社 数据交换系统、数据交换方法、与数据交换程序
CN107609406A (zh) * 2017-08-09 2018-01-19 南京邮电大学 一种基于地理编码的快递地址加密方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5387783A (en) * 1992-04-30 1995-02-07 Postalsoft, Inc. Method and apparatus for inserting and printing barcoded zip codes
WO1996034354A1 (en) * 1995-04-28 1996-10-31 United Parcel Service Of America, Inc. System and method for validating and geocoding addresses
US5881169A (en) * 1996-09-13 1999-03-09 Ericsson Inc. Apparatus and method for presenting and gathering text entries in a pen-based input device
IL147736A0 (en) * 1999-07-20 2002-08-14 Inmentia Inc Method and system for organizing data

Also Published As

Publication number Publication date
JP2007535009A (ja) 2007-11-29
CA2543159C (en) 2010-08-10
EP1687741A1 (en) 2006-08-09
CN100421107C (zh) 2008-09-24
CA2543159A1 (en) 2005-06-02
WO2005050481A1 (en) 2005-06-02
AU2003284305A1 (en) 2005-06-08
CN1879104A (zh) 2006-12-13

Similar Documents

Publication Publication Date Title
US7305404B2 (en) Data structure and management system for a superset of relational databases
Wang et al. Fast large-scale trajectory clustering
US6381601B1 (en) Grouping and duplicate removal method in a database
JP3581831B2 (ja) 表形式データの検索・集計・ソート方法及び装置
Ullman Principles of database systems
JP4256416B2 (ja) データ構造変換システム及びプログラム
US20170147674A1 (en) Storing and retrieving data of a data cube
CN111506621B (zh) 一种数据统计方法及装置
US7584189B2 (en) Sentence classification device and method
JP4609995B2 (ja) オンライン分析処理(olap)のための方法およびシステム
CN110532309B (zh) 一种高校图书馆用户画像系统的生成方法
EP2609525A1 (en) Geospatial database integration
JPH09265479A (ja) 多次元データ処理方法
JP2012043456A (ja) 参照を使用してジェネリック・データ・アイテムに関連するデータ管理アーキテクチャ
MXPA06004481A (es) Estructura de datos y sistema de administracion para un super conjunto de bases de datos relacionales.
CN108710660A (zh) 一种数据库的物项属性参数建模和存储方法
US20060074971A1 (en) Method and system for formatting and indexing data
US6810399B2 (en) Property extensions
JP4287464B2 (ja) システム基盤構成策定支援システム及び支援方法
US20100121837A1 (en) Apparatus and Method for Utilizing Context to Resolve Ambiguous Queries
US10628396B1 (en) Batch automated blocking and record matching
US7162505B2 (en) Classification of data for insertion into a database
JP2006171800A (ja) データ集計装置、その方法、及びプログラム
US7996425B1 (en) Storing element-based descriptions of documents in a database
Chu et al. A cloud-based trajectory index scheme