ES2388817T3 - Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea - Google Patents

Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea Download PDF

Info

Publication number
ES2388817T3
ES2388817T3 ES05704881T ES05704881T ES2388817T3 ES 2388817 T3 ES2388817 T3 ES 2388817T3 ES 05704881 T ES05704881 T ES 05704881T ES 05704881 T ES05704881 T ES 05704881T ES 2388817 T3 ES2388817 T3 ES 2388817T3
Authority
ES
Spain
Prior art keywords
entity
records
entity reference
record
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05704881T
Other languages
English (en)
Inventor
Yohendran Arumainayagam
Christoper C. Dozier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Reuters Global Resources ULC
Original Assignee
Thomson Reuters Global Resources ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Reuters Global Resources ULC filed Critical Thomson Reuters Global Resources ULC
Application granted granted Critical
Publication of ES2388817T3 publication Critical patent/ES2388817T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Un sistema que comprende: medios (910) para extraer datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad; medios (920) para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante: la clasificación de los registros de referencia de entidad por apellido; la selección de un registro de referencia de entidad no fusionado y la creación de un registro de perfil de entidad a partir del registro de referencia de entidad no fusionado; y el análisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado; medios (940) para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomía; y medios (950) para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.

Description

Sistemas, metodos, interfaces y soporte l6gico para recogida e integraci6n automatica de datos de entidad en bases de datos y directorios de profesionales en linea.
Aviso de derechos de autor y permiso
5 Una parte de este documento de patente contiene material sujeto a protecci6n de derechos de autor. El propietario de los derechos de autor no tiene objeci6n para la reproducci6n facsimil por cualquiera del documento de patente o la revelaci6n de patente, como aparece en los archivos o registros de patente de la Oficina de Patentes y Marcas, pero de otro modo reserva todos los derechos de autor que sean. El siguiente aviso aplica a este documento: Derechos de autor © 2003, Thomson Global Resources AG.
10 Campo tecnico
Varias realizaciones de la presente invenci6n conciernen a sistemas de recuperaci6n de informaci6n, tales como aquellos que proporcionan documentos legales u otro contenido relacionado.
Antecedentes
En los ultimos aios, el crecimiento fantastico de Internet y otras redes de ordenadores ha alimentado un crecimiento
15 igualmente fantastico en los datos accesibles a traves de estas redes. Uno de los modos fundamentales para interactuar con estos datos es a traves del uso de hiperenlaces dentro de documentos electr6nicos.
Mas recientemente, ha habido interes en documentos de hiperenlaces a otros documentos en base a los nombres de personas en los documentos. Por ejemplo, para facilitar la busqueda legal, West Publishing Company de St. Paul, Minnesota (que hace negocios como Thomson West) proporciona miles de dictamenes judiciales electr6nicos que
20 hiperenlazan los nombres de abogados y jueces con sus entradas biograficas en linea en el Directorio Legal de West, un directorio propietario de aproximadamente 1.000.000 de abogados y 20.000 jueces de EE.UU. Estos hiperenlaces permiten a los usuarios acceder a dictamenes judiciales para obtener rapidamente contacto y otra informaci6n especifica sobre abogados y jueces nombrados en los dictamenes.
Los hiperenlaces en estos dictamenes judiciales se generan automaticamente, usando un sistema que extrae el
25 nombre, el segundo nombre y el apellido; el nombre de la firma de abogados, la ciudad, y el estado; y la informaci6n del tribunal a partir del texto de los dictamenes, y los usa como pistas para determinar si enlazar los abogados y jueces nombrados con sus entradas correspondientes en el directorio de profesionales. Ver Christopher Dozier y Robert Haschart, "Extracci6n Automatica y Enlace de Nombres de Personas en Texto Legal" (Actas de RIAO 2000: Acceso a Informaci6n Multimedia Basada en Contenido. Paris, Francia. Paginas 1305-1321. Abril de 2000). Una
30 mejora a este sistema se describe en Christopher Dozier, Sistemas, Metodos Y Soporte L6gico Para Hiperenlace Automatico De Nombres de Personas En Documentos a Directorios Profesionales, WO 2003/060767A3 24 de julio de 2003.
La WO 03/060767 describe un metodo y sistema para aiadir hiperenlaces a nombres en documentos. Los nombres en los documentos se identifican y comparan con direcciones de nombres para formar los hiperenlaces.
35 La presente invenci6n ha reconocido aun la necesidad adicional de mejora de estos y otros sistemas que generan enlaces automaticos.
De acuerdo con un aspecto, la presente invenci6n proporciona un sistema que comprende: medios para extraer un registro de referencia de entidad de cada uno de una pluralidad de documentos; medios para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad con al menos otro
40 registro de referencia de entidad; medios para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomia; y medios para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
De acuerdo con un segundo aspecto, la presente invenci6n proporciona un metodo que comprende: extraer un registro de referencia de entidad a partir de cada uno de una pluralidad de documentos; formar al menos un perfil de 45 referencia de entidad fusionando al menos uno de los registros de referencia de entidad con al menos otro registro de referencia de entidad; categorizar automaticamente al menos uno de los registros de perfil de entidad en base a una taxonomia experta; y definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos
o conjuntos de datos.
Breve descripcion de los dibujos
50 La Figura 1 es un diagrama de un sistema de recuperaci6n de informaci6n ejemplar 100 que corresponde a una o mas realizaciones de la invenci6n;
La Figura 2 es un diagrama de flujo que corresponde a uno o mas metodos ejemplares del sistema operativo 100 y una o mas realizaciones de la invenci6n;
La Figura 3-8 son facsimiles de interfaces de usuario ejemplares, cada una que corresponde a una o mas realizaciones de la invenci6n.
La Figura 9 es un diagrama de flujo que corresponde a una o mas realizaciones de la invenci6n.
La Figura 10 es un diagrama de flujo que corresponde a una o mas realizaciones adicionales de la invenci6n.
Descripcion detallada de las realizaciones ejemplares
Esta descripci6n, la cual hace referencia e incorpora las Figuras identificadas anteriormente, describe una o mas realizaciones especificas de una invenci6n. Estas realizaciones, ofrecidas no para limitar sino solamente para ejemplificar y enseiar la invenci6n, se muestran y describen en detalle suficiente para permitir a aquellos expertos en la tecnica implementar o practicar la invenci6n. De esta manera, cuando sea adecuado para evitar oscurecer la invenci6n, la descripci6n puede omitir cierta informaci6n conocida para aquellos de los expertos en la tecnica.
Sistema de recuperaci6n de informaci6n ejemplar
La Figura 1 muestra un sistema de recuperaci6n de informaci6n en linea ejemplar 100. El sistema 100 incluye una o mas bases de datos 110, uno o mas servidores 120, y uno o mas dispositivos de acceso 130.
Las bases de datos 110 incluyen un conjunto de una o mas bases de datos. En la realizaci6n ejemplar, el conjunto incluye una base de datos de jurisprudencia 111, un directorio de peritos 112, directorios profesionales o bases de datos de concesi6n de licencias 113, una base de datos de veredictos y acuerdos 114, una base de datos de demandas judiciales 116.
La base de datos de jurisprudencia 111 generalmente incluye texto electr6nico y copias de imagenes de dictamenes judiciales para casos decididos para una o mas jurisdicciones local, estatal, federal, o internacional. El directorio de peritos 112, que esta definido de acuerdo con uno o mas aspectos de la presente invenci6n, incluye una o mas estructuras de bases de datos o registros, tales como la estructura 1121. La estructura 1121 incluye una parte de identificador de expertos 1121 A la cual esta asociada l6gicamente con uno o mas documentos de directorio o entradas 1121B, uno o mas documentos de veredictos o entradas 1121C, y uno o mas articulos 1121D. Algunas realizaciones asocian l6gicamente el identificador de expertos con documentos de demandas judiciales, tales como escritos o informes de expertos y/u otros documentos.
Los directorios de profesionales o bases de datos de concesi6n de licencias 113 incluyen datos de concesi6n de licencias profesionales de una o mas autoridades de concesi6n del estado, federal, o internacional. En la realizaci6n ejemplar, esto incluye autoridades de concesi6n de licencias o credenciales legales, medicas, de ingenieria y cientificas. La base de datos de veredictos y acuerdos 114 incluye texto electr6nico y copias de imagenes de documentos relacionados con el veredicto determinado, daios juzgados, o acuerdos negociados de disputas legales asociadas con casos dentro de la base de datos de jurisprudencia 111. La base de datos de articulos 115 incluye articulos tecnicos, medicos, profesionales, cientificos u otros diarios academicos o de autoridad y publicaciones comerciales de autoridad. Algunos ejemplos incluyen publicaciones de patentes. La base de datos de demandas judiciales 116 incluye texto electr6nico y copias de imagenes de demandas judiciales relacionadas con uno o mas subconjuntos de bases de datos de jurisprudencia de dictamenes judiciales 111. Los documentos de demandas judiciales ejemplares incluyen escritos, mociones, denuncias, alegatos, materia de descubrimiento. Otras bases de datos 117 incluyen una o mas de otras bases de datos que contienen documentos con respecto a noticias, negocios y finanzas, ciencia y tecnologia, medicina y bioinformatica, e informaci6n de propiedad intelectual. En algunos ejemplos, las relaciones l6gicas a traves de los documentos se determinan manualmente y usando procesos de descubrimiento automaticos que apalancan informaci6n tal como identidades de litigantes, fechas, jurisdicciones, identidades de abogados, expedientes judiciales, y asi sucesivamente para determinar la existencia o probabilidad de una relaci6n entre cualquier par de documentos.
Las bases de datos 110, las cuales toman la forma ejemplar de uno o mas dispositivos de almacenamiento de datos electr6nicos, magneticos, u 6pticos, incluyen o se asocian de otro modo con indices respectivos (no se muestran). Cada uno de los indices incluye terminos y/o frases en asociaci6n con las direcciones, identificadores de documentos correspondientes, y otra informaci6n para facilitar la funcionalidad descrita mas adelante. Las bases de datos 112, 114, y 116 estan acopladas o son acoplables a traves de una red de comunicaciones inalambrica o cableada, tal como una red local, amplia, privada, o privada virtual, al servidor 120.
El servidor 120, el cual es representativo generalmente de uno o mas servidores para datos de servicio en forma de paginas web u otras formas de lenguaje de marcado con subprogramas asociados, controles ActiveX, objetos de invocaci6n remota, u otro soporte l6gico relacionado y estructuras de datos para servir clientes de varios "espesores". Mas concretamente, el servidor 120 incluye un procesador 121, una memoria 122, una base de datos de abonados 123, uno o mas motores de busqueda 124 y el m6dulo de soporte l6gico 125.
El procesador 121, el cual es generalmente representativo de uno o mas procesadores locales o distribuidos o maquinas virtuales, se acopla a la memoria 122. La memoria 122, la cual toma la forma ejemplar de uno o mas dispositivos de almacenamiento de datos electr6nicos, magneticos u 6pticos, almacena la base de datos de
suscripci6n 123, los motores de busqueda 124, y el m6dulo de interfaz 125.
La base de datos de suscripci6n 123 incluye datos relacionados con abonados para controlar, administrar, y gestionar el paga segun vayas o acceso basado en suscripci6n de bases de datos 110. La base de datos de abonados 123 incluye datos relacionados con abonados para controlar, administrar, y gestionar el paga segun vayas
o el acceso basado en suscripci6n de bases de datos 110.
Los motores de busqueda 124 proporcionan capacidades de busqueda Booleanas o de lenguaje natural para las bases de datos 110.
El m6dulo interfaz 125, la cual, entre otras cosas define una o parte de una interfaz grafica de usuario que ayuda a los usuarios a definir busquedas para bases de datos 110. El soporte l6gico 125 incluye uno o mas subprogramas compatibles con navegaci6n, plantillas de paginas web, elementos de interfaz de usuario, objetos o rasgos de control u otros objetos o estructuras programaticas. Mas especificamente, el soporte l6gico 125 incluye una interfaz de busqueda 1251 y una interfaz de resultados 1252.
El servidor 120 esta acoplado o es acoplable de manera comunicativa a traves de una red de comunicaciones inalambrica o cableada, tal como una red local, amplia, privada, o privada virtual, a uno o mas dispositivos de acceso, tal como el dispositivo de acceso 130.
El dispositivo de acceso 130 no esta acoplado o es acoplable solamente de manera comunicativa al servidor 130, sino tambien generalmente representativo de uno o mas dispositivos de acceso. En la realizaci6n ejemplar, el dispositivo de acceso 130 toma la forma de un ordenador personal, estaci6n de trabajo, asistente digital personal, telefono m6vil, o cualquier otro dispositivo capaz de proporcionar una interfaz de usuario efectiva con un servidor o base de datos.
Especificamente, el dispositivo de acceso 130 incluye uno o mas procesadores (o circuitos de procesamiento) 131, una memoria 132, una pantalla 133, un teclado 134, y un puntero o selector grafico 135. La memoria 132 almacena el c6digo (legible por maquina o instrucciones programables) para un sistema operativo 136, un navegador 137, y una interfaz de usuario grafica (GUI) 138. En la realizaci6n ejemplar, sistema operativo 136 toma la forma de una versi6n del sistema operativo Microsoft Windows, y el navegador 137 toma la forma de una versi6n de Microsoft Internet Explorer. El sistema operativo 136 y el navegador 137 no solamente reciben entradas desde el teclado 134 y el selector (o rat6n) 135, sino que tambien soporta la representaci6n de GUI 138 en la pantalla 133. Tras la representaci6n, la GUI 138 presenta datos en asociaci6n con uno o mas rasgos de control interactivos (o elementos de interfaz de usuario).
(La realizaci6n ejemplar define una o mas partes de la interfaz 138 usando subprogramas u otros objetos o estructuras programaticas desde el servidor 120.)
Especificamente, la interfaz grafica de usuario 138 define o proporciona una o mas regiones de control de visualizaci6n, tales como una regi6n de consulta 1381, y una regi6n de resultados 1382. Cada regi6n (o pagina en algunas realizaciones) se define respectivamente en la memoria para visualizar datos desde las bases de datos 110 y/o el servidor 120 en combinaci6n con uno o mas rasgos de control interactivos (elementos o artilugios). En la realizaci6n ejemplar, cada uno de estos rasgos de control toma la forma de un hiperenlace u otra entrada de comando compatible con navegador.
Mas concretamente, la regi6n de consulta 1381 incluye rasgos de control interactivos, tales como una parte de entrada de consulta 1381A para recibir la entrada de usuario al menos parcialmente definiendo una consulta del perfil y un bot6n de presentaci6n de consulta 1381B para presentar la consulta del perfil al servidor 120 para datos desde, por ejemplo, bases de datos de expertos 112.
La regi6n de resultados 1382, la cual visualiza los resultados de las busquedas para una consulta presentada, incluye una parte de enumeraci6n de resultados 1382A y una parte de visualizaci6n de documentos 1382B. La parte de enumeraci6n 1382A incluye rasgos de control 2A1 y 2A2 para el acceso o recuperaci6n de uno o mas documentos de resultado de busqueda correspondientes, tales como datos de perfil profesional y documentos relacionados, desde una o mas bases de datos 110, tales como la base de datos de expertos 112, a traves del servidor 120. Cada rasgo de control incluye un identificador de documentos o etiqueta respectiva, tal como EXP 1, EXP 2 que identifican el respectivo nombre y/o ciudad, estado, y datos de conocimiento de la materia objeto para el experto o profesional correspondiente.
La parte de pantalla 1382B visualiza al menos una parte del texto completo de uno visualizado primero o seleccionado por el usuario de los perfiles identificados dentro de la parte de enumeraci6n 1382A, EXP 2 en la ilustraci6n. (Algunas realizaciones presentan regiones 1382A y 1382B como regiones con fichas seleccionables.) La parte 1382B tambien incluye rasgos 2B1, 2B2, 2B3, y 2B4. La selecci6n de usuario del rasgo 2B 1 inicia la recuperaci6n y visualizaci6n del texto del perfil para el experto seleccionado, EXP 2; la selecci6n del rasgo 2B2 inicia la recuperaci6n y visualizaci6n de los datos de licencias para cualquier licencia y otras credenciales mantenidas por la copia de la imagen del experto o profesional seleccionado del documento visualizado en la regi6n 1382B en una ventana separada; la selecci6n del rasgo 2B3 inicia la visualizaci6n y la recuperaci6n de los datos de veredicto
relacionados con el experto o profesional; y la selecci6n de rasgo 2B4 inicia la recuperaci6n y visualizaci6n de articulos (desde la base de datos 115) que estan relacionados con, por ejemplo autorizado por, el experto o profesional. Otras realizaciones incluyen rasgos de control adicional para acceder a documentos de demandas judiciales, tales como escritos, y/o informes periciales autorizados por el experto o profesional, o incluso expedientes de dep6sito o prueba en que el experto o el testimonio fue un participante. Aun otros ejemplos proporcionan rasgos de control para iniciar una busqueda de Internet basada en el experto seleccionado y otros datos y para filtrar resultados de tal busqueda basados en el perfil del experto o profesional.
Metodos ejemplares de funcionamiento
La Figura 2 muestra un diagrama de flujo 200 de uno o mas metodos ejemplares de funcionamiento de un sistema de gesti6n de informaci6n, tal como el sistema 100. El diagrama de flujo 200 incluye los bloques 210-290, los cuales se disponen y describen en una secuencia de ejecuci6n serie en la realizaci6n ejemplar. No obstante, otros ejemplos ejecutan dos o mas bloques en paralelo usando los procesadores multiples o dispositivos tipo procesador o un procesador unico organizado como dos o mas maquinas virtuales o sub procesadores. Otros ejemplos tambien alteran la secuencia de procesos o proporcionan diferentes partes funcionales para lograr resultados analogos. Por ejemplo, algunos ejemplos pueden alterar la asignaci6n cliente servidor de funciones, tales que las funciones mostradas y descritas en el lado del servidor se implementan en todo o parte en el lado del cliente, y viceversa. Ademas, aun otros ejemplos implementan los bloques como dos o mas m6dulos de componentes fisicos interconectados con las seiales de control y datos relacionadas comunicadas entre y a traves de los m6dulos. De esta manera, esto (y otros flujos de proceso ejemplar en esta descripci6n) aplica a implementaciones de soporte l6gico, componentes fisicos, y microprogramas.
El bloque 210 conlleva presentar una interfaz de busqueda a un usuario. En la realizaci6n ejemplar, esto conlleva que un usuario dirija un navegador en un dispositivo de acceso cliente a la direcci6n del protocolo de internet (IP) para un sistema de recuperaci6n de informaci6n en linea, tal como el sistema Westlaw y luego se registra en el sistema. El registro con exito en una interfaz de busqueda basada en web, tal como la interfaz 138 en la Figura 1 (o una o mas partes de la misma) que se sacan del servidor 120, almacenan en la memoria 132, y visualizan por el dispositivo de acceso cliente 130. La ejecuci6n entonces avanza al bloque 220.
El bloque 220 conlleva la recepci6n de una consulta. En la realizaci6n ejemplar, la consulta define uno o mas atributos de una entidad, tal como la persona profesional. En algunas realizaciones, la cadena de consultas incluye un conjunto de limites y/o conectores, y en otra realizaci6n incluye una cadena de lenguaje natural. Tambien, en algunos ejemplos el conjunto de bases de datos objetivo se define automaticamente o por defecto en base a la forma de la interfaz del sistema o busqueda. Las Figuras 3 y 4 muestran interfaces de busqueda alternativas 300 y 400 que una o mas realizaciones usan en lugar de la interfaz 138 en la Figura 1. La ejecuci6n continua en el bloque
230.
El bloque 230 conlleva presentar resultados de busqueda al usuario a traves de una interfaz grafica de usuario. En la realizaci6n ejemplar, esto conlleva al servidor o componentes bajo control o mando del servidor, ejecutar la consulta frente una o mas bases de datos 110, por ejemplo, la base de datos de expertos 110, e identificar documentos, tales como perfiles profesionales, que satisfacen los criterios de consulta. Un listado de resultados entonces se presenta o reproduce como parte de una interfaz basada en web, tal como la interfaz 138 en la Figura 1 o interfaz 500 en la Figura 5. La ejecuci6n pasa al bloque 240.
El bloque 240 conlleva presentar informaci6n adicional con respecto a uno o mas de los profesionales enumerados. En la realizaci6n ejemplar, esto conlleva recibir una consulta en forma de una selecci6n de usuario de uno o mas de los perfiles profesionales enumerados en los resultados de busqueda. Estos resultados adicionales se pueden visualizar como se muestra en la interfaz 138 en la Figura 1 o las respectivas interfaces 600, 700, y 800 en las Figuras 6, 7, y 8. La interfaz 600 muestra un listado de enlaces 610 y 620 para informaci6n adicional relacionada con el profesional seleccionado. Como se muestra en la Figura 7, la selecci6n del enlace 610 inicia la recuperaci6n y visualizaci6n de un documento de veredicto (o en algun caso una lista de documentos de veredictos asociados) en la interfaz 700. Y, como se muestra en la Figura 8, la selecci6n del enlace 620 inicia la recuperaci6n y visualizaci6n de un articulo (o en algunos casos una lista de articulos) en la interfaz 800.
Metodo Ejemplar de Construcci6n de Directorio de Expertos
En la Figura 9, el diagrama de flujo 900 muestra un metodo ejemplar de construcci6n de un directorio o base de datos de expertos tal como se usa en el sistema 100. El diagrama de flujo 900 incluye los bloques 910-960.
En el bloque 910, el metodo ejemplar comienza con la extracci6n de los registros de referencia de entidad de los documentos de texto. En la realizaci6n ejemplar, esto conlleva extraer las referencias de entidad a partir de aproximadamente 300.000 documentos de acuerdo de veredicto del jurado (JVS) usando transductores de estado finitos. Los documentos JVS tienen una estructura consistente que incluye una secci6n o parrafo de peritos, tal como aquella ejemplificada en la Tabla 1.
Tabla 1: Seccion de Peritos de Documento de Veredictos y Acuerdos del Jurado (JVS)
EXPERTOS: Demandante: Neal Benawitz MD, farmaceutico, Centro Medico UCSF, San Francisco. David M. Burns, neum6logo, UC San
Diego, Div. de Medicina Pulmonar y Cuidados Intensivos, La Jolla. Acusado: Jerry Whidby PhD, quimico, Philip Morris Co. Richmond. VA.
La realizaci6n ejemplar usa un programa de analisis para localizar los parrafos de peritos y encontrar elementos lexicos (es decir, terminos usados en esta area de objetivo particular) que pertenecen a un individuo. Estos elementos lexicos incluyen nombre, titulaci6n, area de conocimiento, organizaci6n, ciudad, y estado. El analisis de un parrafo conlleva separarlo en frases, y luego analizar cada elemento usando un transductor de estado finito separado o especifico. El siguiente ejemplo muestra las expresiones habituales del transductor de estado finito usado por el elemento de organizaci6n. (Las variables se prefijan mediante $.)
$ORG = ($UNIVERSIDAD I $COMPANIAI$FIRM.)
$UNIVERSIDAD = ($UNIVERSIDAD1 I $UNIVERSIDAD2)
$UNIVERSIDAD1 = (UniversidadIEscuela..) (de) [A-Z][a-z]+
$UNIVERSIDAD2 = ([A-Z][a-z]+ $ESPACIO) + (UniversidadIEscuela..)
Tipicamente un experto se enumera en una frase junto con su area de conocimiento y otra informaci6n. Si mas de un experto se menciona en la frase, el area de conocimiento y otros elementos mas cercanos al nombre se asocian tipicamente con ese nombre. Cada documento JVS generalmente enumera solamente un perito; no obstante, algunos peritos son referencias en mas de un documento JVS. La Tabla 2 muestra un ejemplo de unos registros de referencia de entidad.
Tabla 2: Registro de Referencia Estructurado de Peritos Creado por Analizadores de Expresiones Habituales
nombre
ARTHUR
segundo nombre
apellido
ABLIN
sufijo
titulaci6n
Doctor en Medicina
organizaci6n
Conocimiento
Hematologia/oncologia pediatrica
ciudad
SAN FRANCISCO
estado
CA
Una vez que se definen los registros de referencia de entidad, la ejecuci6n continua en el bloque 920.
El bloque 920 conlleva definir los registros de perfil a partir de los registros de referencia de entidad: En la realizaci6n ejemplar, definir los registros de perfil conlleva fusionar registros de referencia de peritos que se refieren a la misma persona para crear un unico registro de perfil de perito para el experto. Para este fin, las realizaciones ejemplares clasifican los registros de referencia por el apellido para definir un numero de grupos de apellidos. Los registros dentro de cada grupo de "apellidos" entonces se procesa seleccionando un registro de referencia experto no fusionado y creando un nuevo registro de perfil del experto a partir de este registro seleccionado. El nuevo registro de referencia de experto entonces se marca como no fusionado y se compara con cada registro de referencia no fusionado en el grupo usando coincidencia Bayesiana para calcular la probabilidad de que el experto en el registro de perfil se refiera al mismo individuo referenciado en el registro. Si la probabilidad de coincidencia calculada excede un umbral de coincidencia, la referencia se marca como "fusionada". Si los registros no fusionados permanecen en el grupo, el ciclo se repite.
Seialar que todavia es posible para los registros duplicados residir en el archivo del perfil si dos o mas registros de referencia pertenecen a un individuo (por ejemplo, debido a un apellido mal escrito). Para abordar esta posibilidad, se hace un paso final sobre el archivo de perfil fusionado, y las parejas de registros se marcan para revisi6n manual. La Tabla 3 muestra un registro de perfil del experto creado a partir de registros de referencia del experto.
Tabla 3 Registro de Perfil del Experto Creado a partir de Registros de Referencia del Experto
nombre
ARTHUR
segundo nombre
apellido
ABLIN
sufijo
titulaci6n
Doctor en Medicina
organizaci6n
conocimiento
Hematologia/oncologia pediatrica
Subcat 1
Subcat 2
Subcat 3
categoria
direcci6n
ciudad
SAN FRANCISCO
estado
CA
El bloque 930 conlleva aiadir informaci6n adicional a los registros de referencia del experto. En la realizaci6n
5 ejemplar, esto conlleva recoger informaci6n recolectada a partir de otras bases de datos y fuentes, tales como de autoridades de concesi6n de licencias profesionales, directorios telef6nicos, y asi sucesivamente. Las referencias a expertos en documentos JVS, la fuente de registro original en esta realizaci6n, a menudo tienen poca o ninguna informaci6n de ubicaci6n para expertos, mientras que los registros de licencias profesionales tipicamente incluyen el nombre completo del experto, y la direcci6n de casa y/o negocio actual completa, haciendolas una fuente
10 prometedora de datos adicionales.
Una autoridad de concesi6n de licencias es la Agencia de Lucha Antidrogas, la cual concede licencias a los profesionales de la sanidad para prescribir drogas.
En la determinaci6n de si un registro de licencia recolectado (analogo a un registro de referencia) y la persona experta se refieren a la misma persona, la realizaci6n ejemplar calcula una probabilidad de coincidencia Bayesiana 15 en base al nombre, segundo nombre, apellido, sufijo del nombre, informaci6n de la ciudad - estado, area de conocimiento, y rareza del nombre. Si la probabilidad de coincidencia cumple o excede una probabilidad umbral, uno
o mas elementos de informaci6n a partir del registro de licencia recolectado se incorporan en el registro de referencia del experto. Si los criterios de umbral no se cumplen, el registro de licencia recolectado se almacena en una base de datos para la consideraci6n de la fusi6n con registros aiadidos o recolectados mas tarde.
20 (Algunas realizaciones realizan un procedimiento de extracci6n sobre los datos suplementarios similar a aquel descrito en el bloque 910 para definir registros de referencia, los cuales entonces se envian como un conjunto de procesamiento de fusi6n como en el bloque 910 con los registros de referencia del experto.)
Tabla 4: Registro de Perfil del Experto en el cual los Campos de Segundo Nombre, Direccion, y Codigo Postal se Rellenan o Recolectan a partir del Registro de Licencia del Profesional
nombre
ARTHUR
segundo nombre
R
apellido
ABLIN
sufijo
titulaci6n
Doctor en Medicina
organizaci6n
Conocimiento
Hematologia/oncologia pediatrica
Subcat 1
Pediatria
Subcat 2
Sangre y Plasma
Subcat 3
oncologia
categoria
Medica y quirurgica
direcci6n
43 Culloden Pk Road
ciudad
SAN FRANCISCO
estado
CA
C6digo Postal
94901
El bloque 940 conlleva la categorizaci6n de perfiles de expertos por area de conocimiento. En la realizaci6n ejemplar, cada registro de perito se asigna a una o mas categorias de clasificaci6n en una taxonomia de
5 conocimiento. La categorizaci6n de los registros de entidad permite a los usuarios navegar y buscar perfiles de peritos (u otros profesionales) por area de conocimiento. Para asignar un registro de perfil del experto a una subcategoria de conocimiento, la realizaci6n ejemplar usa un categorizador de conocimiento y una taxonomia que contiene categorias y subcategorias de nivel superior.
La taxonomia ejemplar incluye las siguientes categorias de nivel superior: Accidentes y Lesiones; Contabilidad y
10 Economia; Ordenadores y Electr6nica; Construcci6n y Arquitectura; Criminal, Fraude e Identidad Personal; Empleo y Vocacional; Ingenieria y Ciencia; Medioambiente; Familia y Custodia de hijos; Legal y Aseguradoras; Medico y Quirurgico; Propiedad e Inmobiliaria; Psiquiatria y Psicologia; Vehiculos, Transporte, Equipos y Maquinaria. Cada categoria incluye una o mas subcategorias. Por ejemplo, la categoria "Accidentes y Lesiones" tiene las siguientes subcategorias: Ejercicios Aer6bicos, Animales, Ropa, Asbestos, Paseos en Barco, Bombardeos,
15 Quemaduras/Termicas, Cuidado de Niios, Seguridad de Niios, Construcci6n, Forense, Cosmetica/Centros de Belleza/Peluquerias/Tatuajes, Mordeduras de Perro, Entretenimiento, y Ejercicio.
La asignaci6n de categorias de la materia objeto a un registro de perfil del experto conlleva usar una funci6n que asigna un descriptor de profesional asociado con el experto a un nodo hoja en la taxonomia de conocimiento. Esta funci6n se representa con la siguiente ecuaci6n:
20 T)=)f)()S) )
donde T indica un conjunto de nodos de taxonomia, y S es el descriptor del profesional. La funci6n ejemplar f usa un lexico de 500 conjuntos de cuatro caracteres que asigna descriptores de profesionales al area de conocimiento. Por ejemplo, los expertos que tienen el descriptor de profesional "onco" se categorizan con las subcategorias de especialista en oncologia, onc6logo, y onc6logo pediatra. Otras taxonomias tambien son factibles. La realizaci6n 25 ejemplar permite descriptores para asignar a mas de un area de conocimiento (es decir, categoria o subcategoria) en la taxonomia. Por ejemplo, "cirujano pediatra" se puede asignar tanto al nodo "pediatra" como a los nodos "cirujano". La Tabla 5 muestra un ejemplo de un registro de perfil del experto en el cual el campo de conocimiento se ha asignado a la categoria "Medica y Quirurgica" y a las subcategorias "pediatrica", "sangre y plasma," y "oncologia."
Tabla 5: Registro de Perfil del Experto con Area de Conocimiento Asignada a "Medica y Quirurgica"
nombre
ARTHUR
segundo nombre
apellido
ABLIN
sufijo
titulaci6n
Doctor en Medicina
organizaci6n
Conocimiento
Hematologia/oncologia pediatrica
Subcat 1
Pediatria
Subcat 2
Sangre y Plasma
Subcat 3
Oncologia
categoria
Medica y quirurgica
direcci6n
ciudad
SAN FRANCISCO
estado
CA
El bloque 940 conlleva asociar uno o mas documentos de texto y/o conjuntos de datos adicionales con uno o mas de los perfiles de profesionales. Para este fin, la realizaci6n ejemplar asocia o enlaza l6gicamente uno o mas documentos JVS y/o articulos de Medline a registros de perfil del perito usando coincidencia de registros basados en Bayesiano. La Tabla 6 muestra una articulo Medline muestra.
Tabla 6: Texto Muestra de Articulo de Medline
TiTULO: Resultados funcionales y clinicos de terapia de salvar un miembro para sarcomas de extremidades
pediatricas AUTORES: Bertucio C S; Wara W M; Matthay K K; Ablin A R; Johnston J O; O'Donnell R J; Weinberg V; Haas-Kogan D A
Departamento de Radiaci6n de Oncologia, Universidad de California-San Francisco, 505 Parnassus Avenue, San Francisco, CA 94143-0226. EE.UU. DIARIO: Diario Internacional de radiaci6n de oncologia, biologia, fisica (Estado Unidos) FECHA: 1 de marzo de 2001
Para enlazar documentos JVS y resumenes de Medline con registros de perfiles del experto, los registros de referencia del experto se extraen a partir de los articulos usando uno o mas analizadores adecuados a traves de analisis y coincidencia con registros del perfil usando una red de inferencia Bayesiana similar a la tecnologia de
10 coincidencia de perfil descrita previamente. Para documentos JVS, la red Bayesiana calcula las probabilidades de coincidencia usando siete partes de evidencia de coincidencia: apellido, nombre, segundo nombre, sufijo de nombre, ubicaci6n, organizaci6n y area de conocimiento. Para articulos de Medline, la probabilidad de coincidencia se basa adicionalmente en la rareza del nombre, como se describi6 en la solicitud de patente Dozier mencionada previamente.
15 La Figura 10 muestra un diagrama de flujo 1000 de un metodo ejemplar de crecer y mantener uno o mas directorios de entidades, tales como la base de datos de expertos que se usa en el sistema 100. El diagrama de flujo 1 100 incluye los bloques de procesos 1010-1050.
En el bloque 1010, el metodo ejemplar comienza con la recepci6n de un documento en la realizaci6n ejemplar, esto conlleva la recepci6n de un documento sin marcar, tal como un dictamen o informe judicial. No obstante, otras
20 realizaciones reciben y procesan otros tipos de documentos. La ejecuci6n entonces avanza al bloque 1020.
El bloque 1020 conlleva determinar el tipo de documento. Las realizaciones ejemplares usan uno o mas metodos para determinar el tipo de documento, por ejemplo, buscar el formato y sintaxis y/o las palabras clave del documento particular para diferenciar entre un conjunto de tipos. En algunas realizaciones, el tipo se puede inferir a partir de la
fuente del documento. Los tipos de contenido entrante, tales como jurisprudencia, veredictos del jurado, revisiones de ley, informes, etc., tienen una variedad de diferencias de gramatica, sintaxis, y estructurales. Despues de que se determina el tipo (o descripci6n de documento), la ejecuci6n continua en el bloque 1030.
El bloque 1030 conlleva extraer uno o mas registros de referencia de entidad a partir del documento recibido en base al tipo determinado del documento. En la realizaci6n ejemplar, se extraen cuatro tipos de registros de entidad: nombres de personas, tales como abogados, jueces, peritos; nombres de organizaciones, tales como firmas y compaiias; nombres de productos, tales como farmacos y quimicos; y perfiles del hecho ("lengua vernacula" del area objeto). Los analizadores especializados o configurables (transductores de estado finitos), los cuales se seleccionan o configuran en forma del tipo de documento determinado y el registro de entidad que se construye, identifican y extraen la informaci6n de entidad para cada tipo de entidad.
Los analizadores extraen informaci6n buscando especificamente una entidad nominada (persona, direcci6n, compaiia, etc.) o mediante relaciones entre entidades. La extracci6n de texto del analizador se basa en los criterios de entrada de datos. Por ejemplo, los datos mas estructurados (marcados) permiten un conjunto de reglas "mas ajustadas" a ser construidas dentro de un analizador. Este conjunto de reglas permiten informaci6n mas especifica a ser extraida acerca de una entidad particular. Una colecci6n de datos mas "libre", tal como un sitio web, no es tan favorable a los analizadores basados en reglas. Una colecci6n tambien podria incluir una combinaci6n de datos estructurados, semiestructurados, y libres. Mas concretamente, los analizadores se desarrollan a traves de metodos de "expresi6n habitual". Los servidores de expresiones habituales son "reglas" para analizadores para encontrar tipos de entidad y categorias de informaci6n.
El bloque 1040 intenta enlazar o asociar l6gicamente cada registro de referencia de entidad extraido con uno o mas directorios de autoridad existentes. En la realizaci6n ejemplar, esto conlleva calcular una probabilidad de coincidencia Bayesiana para cada referencia de entidad extraida y uno mas registros candidatos correspondientes en directorios (o bases de datos) correspondientes que han sido designados como autorizados en terminos de precisi6n aceptada. Si la probabilidad de coincidencia satisface los criterios de coincidencia, los registros se fusionan
o asocian y el documento de entrada. La ejecuci6n entonces pasa al bloque 1050.
El bloque 1050 conlleva enriquecer los registros de referencia de entidad sin coincidencia usando un proceso de coincidencia. En la realizaci6n ejemplar, este proceso de enriquecimiento conlleva tipos especificos de operaci6n de datos recolectados en la web, otras bases de datos, y otras direcciones o listas, para montar una cache de nueva informaci6n de perfil relevante para bases de datos, tal como la base de datos de expertos 112 en la Figura 1. Los registros de entidad no coincidentes o no marcados entonces se hacen coincidir frente a los registros de entidad recolectados usando coincidencia Bayesiana. Aquellos que satisfacen los criterios de coincidencia se refieren a un proceso de control de calidad para verificaci6n o confirmaci6n anterior a aiadir al directorio de entidad relevante. El proceso de control de calidad puede ser manual, semiautomatico, o completamente automatico. Por ejemplo, algunas realizaciones basan el tipo de control de calidad en el grado para el cual se exceden los criterios de coincidencia.
En algunos ejemplos los bloques 1050 funcionan en paralelo con los bloques 1010-1040, recuperando continuamente nuevos datos relacionados con la entidad usando cualquier numero de rastreadores web, bases de datos relacionales, o CD, e intentando construir nuevos registros de entidad.

Claims (1)

  1. REIVINDICACIONES
    1� Un sistema que comprende:
    medios (910) para extraer datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad;
    5 medios (920) para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante:
    la clasificaci6n de los registros de referencia de entidad por apellido;
    la selecci6n de un registro de referencia de entidad no fusionado y la creaci6n de un registro de perfil de 10 entidad a partir del registro de referencia de entidad no fusionado; y
    el analisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado;
    medios (940) para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomia; y
    15 medios (950) para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
    2� El sistema de la reivindicaci6n 1, que ademas comprende:
    medios de interfaz grafica de usuario (138) para definir una consulta relacionada con una entidad, para ver al menos un documento resultante de laconsulta, para seleccionar al menos uno de los enlaces definidos dentro de
    20 un documento legal, financiero, sanitario, cientifico, o educativo, y para provocar la recuperaci6n y visualizaci6n de al menos una parte de uno de los registros de perfil de entidad.
    3� El sistema de la reivindicaci6n 1 o reivindicaci6n 2, en el que al menos uno de los medios enumerados incluye uno o mas procesadores, medio legible por ordenador, dispositivos de visualizaci6n, y comunicaciones de red, con el medio legible por ordenador que incluye instrucciones codificadas y estructuras de datos.
    25 4� El sistema de cualquier reivindicaci6n precedente:
    en el que al menos uno de otros registros de referencia de entidad estan contenidos en una base de datos (100);
    en el que los medios para formar al menos un registro de perfil de entidad puede fallar al fusionar al menos uno de los registros de referencia de entidad con al menos uno de otro de los registros de referencia de entidad en la base de datos; y
    30 en el que el sistema ademas comprende:
    medios, sensibles a un fallo al fusionar al menos uno de los registros de referencia de entidad con al menos uno de los otros registros de referencia de entidad, para intentar hacer coincidir cada uno del al menos un registro de referencia de entidad con un conjunto de registros de referencia de entidad recolectados fuera de la base de datos; y
    35 medios, sensibles a una coincidencia de al menos uno de los registros de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados, para fusionar los registros y aiadirlos a la base de datos.
    5� El sistema de cualquier reivindicaci6n precedente, en el que los documentos comprenden documentos de acuerdos de veredictos del jurado.
    40 6� El sistema de la reivindicaci6n 5, en el que los medios para extraer los registros de entidad comprenden transductores de estado finitos.
    �� El sistema de cualquier reivindicaci6n precedente, en el que los medios para extraer al menos uno de los registros de referencia de entidad incluyen los medios para identificar el nombre, el grado de educaci6n, el area de conocimiento, la organizaci6n, la ciudad, y el estado.
    45 �� El sistema de la reivindicaci6n 4, en el que los medios para intentar hacer coincidir al menos uno de los registros de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados incluyen medios para calcular una probabilidad de coincidencia Bayesiana.
    9� El sistema de cualquier reivindicaci6n precedente:
    en el que cada uno de los registros de referencia de entidad referencia una persona; y
    en el que los medios para categorizar al menos uno de los registros de entidad definidos en base a una taxonomia se adaptan para categorizar automaticamente cada registro de referencia de entidad a una taxonomia de conocimiento.
    10� El sistema de cualquier reivindicaci6n precedente, los medios para extraer automaticamente registros de referencia de entidad se adaptan para realizar la extracci6n en base al tipo de documento.
    11� Un metodo que comprende:
    extraer (910) los datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad;
    formar (920) al menos un perfil de referencia de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante:
    la clasificaci6n de los registros de referencia de entidad por apellido;
    la selecci6n de un registro de referencia de entidad no fusionado y la creaci6n de un registro de perfil de entidad a partir del registro de referencia de entidad no fusionado; y
    el analisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado;
    categorizar automaticamente (940) al menos uno de los registros de perfil de entidad en base a una taxonomia de conocimiento; y
    definir enlaces (950) entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
    12� El metodo de la reivindicaci6n 11, que ademas comprende:
    recibir una consulta (210) relacionada con una entidad, visualizando (230) uno o mas documentos resultantes de la consulta, recibir una selecci6n de uno o mas de los enlaces definidos dentro de un documento legal, financiero, sanitario, cientifico, o educativo; y la recuperaci6n y visualizaci6n (240) de al menos una parte del al menos un registro de perfil de entidad.
    13� El metodo de la reivindicaci6n 11 o reivindicaci6n 12,
    en el que el al menos uno de otros registros de entidad estan contenidos en una base de datos (100); en el que al menos uno de los registros de referencia de entidad pueden no estar fusionados con al menos uno de otros registros de referencia de entidad en la base de datos; y
    en el que el metodo ademas comprende:
    en respuesta a un fallo fusionar al menos uno de los registros de referencia de entidad con al menos uno de los otros registros de referencia de entidad, intentar hacer coincidir cada uno del al menos un registro de referencia de entidad con un conjunto de registros de referencia de entidad recolectados fuera de la base de datos; y
    en respuesta a una coincidencia del al menos un registro de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados, fusionar los registros coincidentes y aiadirlos a la base de datos.
    14� Un medio portador que transporta un c6digo legible por ordenador para controlar un ordenador para llevar a cabo el metodo de cualquiera de las reivindicaciones 11 a 13.
ES05704881T 2003-12-31 2005-01-03 Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea Active ES2388817T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US53358803P 2003-12-31 2003-12-31
US533588P 2003-12-31
PCT/US2005/000033 WO2005066848A1 (en) 2003-12-31 2005-01-03 Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories

Publications (1)

Publication Number Publication Date
ES2388817T3 true ES2388817T3 (es) 2012-10-18

Family

ID=34748921

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05704881T Active ES2388817T3 (es) 2003-12-31 2005-01-03 Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea

Country Status (13)

Country Link
US (2) US7571174B2 (es)
EP (2) EP2270688A1 (es)
JP (2) JP4919487B2 (es)
CN (1) CN100472520C (es)
AR (1) AR047362A1 (es)
AT (1) ATE551658T1 (es)
AU (1) AU2005204147A1 (es)
BR (1) BRPI0506673A (es)
CA (1) CA2553196C (es)
ES (1) ES2388817T3 (es)
HK (1) HK1104101A1 (es)
NZ (1) NZ548804A (es)
WO (1) WO2005066848A1 (es)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7333966B2 (en) 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
AU2003300142A1 (en) 2002-12-30 2004-07-29 West Services, Inc. Knowledge-management systems for law firms
NZ548804A (en) * 2003-12-31 2008-11-28 Thomson Global Resources Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories
US9734241B2 (en) * 2004-06-23 2017-08-15 Lexisnexis, A Division Of Reed Elsevier Inc. Computerized system and method for creating aggregate profile reports regarding litigants, attorneys, law firms, judges, and cases by type and by court from court docket records
US9411879B2 (en) * 2005-01-12 2016-08-09 Thomson Reuters Global Resources Systems, methods, and interfaces for aggregating and providing information regarding legal professionals
US7386550B2 (en) * 2005-08-12 2008-06-10 Xerox Corporation Document anonymization apparatus and method
WO2007067926A2 (en) * 2005-12-06 2007-06-14 Ingenix, Inc. Analyzing administrative healthcare claims data and other data sources
US8738639B1 (en) * 2006-02-23 2014-05-27 Verizon Data Services Llc Methods and systems for an information directory providing audiovisual content
MX2008014893A (es) * 2006-05-23 2009-05-28 David P Gold Sistema y metodo para organizar, procesar y presentar informacion.
US8595245B2 (en) * 2006-07-26 2013-11-26 Xerox Corporation Reference resolution for text enrichment and normalization in mining mixed data
CN101681362B (zh) * 2007-01-05 2013-08-21 桑帕尔斯技术有限公司 存储优化方法
US20080177566A1 (en) * 2007-01-19 2008-07-24 Kryptiq Corporation Provider directory publisher
WO2008111939A1 (en) * 2007-03-13 2008-09-18 Center'd Corporation People and business search result optimization
US20080228719A1 (en) * 2007-03-13 2008-09-18 Fatdoor, Inc. People and business search result optimization
WO2008113045A1 (en) 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
US8156166B2 (en) * 2007-08-06 2012-04-10 Intuit Inc. Method and apparatus for selecting a doctor based on an observed experience level
US20090076836A1 (en) * 2007-08-07 2009-03-19 Jeff Arvidson Systems, methods, software and interfaces for reporting results derived from jury verdict summary content, court documents and other analytical and litigation materials
US20090055262A1 (en) * 2007-08-23 2009-02-26 Terri Coulter System and method for advertising testimonial services
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
WO2009052308A1 (en) 2007-10-17 2009-04-23 Roseman Neil S Nlp-based content recommender
US20090106225A1 (en) * 2007-10-19 2009-04-23 Smith Wade S Identification of medical practitioners who emphasize specific medical conditions or medical procedures in their practice
US9501467B2 (en) * 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
EP2227756A4 (en) * 2007-12-31 2012-12-12 Thomson Reuters Glo Resources SYSTEM, METHOD AND SOFTWARE TO SEARCH, ANALYZE AND COMPARE EXPERT WITNESSES
US8843522B2 (en) * 2008-09-15 2014-09-23 Thomson Reuters (Markets) Llc Systems and methods for rapid delivery of tiered metadata
US8726236B2 (en) * 2009-10-26 2014-05-13 International Business Machines Corporation Determining context specific content
US9026412B2 (en) * 2009-12-17 2015-05-05 International Business Machines Corporation Managing and maintaining scope in a service oriented architecture industry model repository
US9111004B2 (en) 2009-12-17 2015-08-18 International Business Machines Corporation Temporal scope translation of meta-models using semantic web technologies
US8600173B2 (en) * 2010-01-27 2013-12-03 Dst Technologies, Inc. Contextualization of machine indeterminable information based on machine determinable information
US8943145B1 (en) * 2010-02-08 2015-01-27 Intuit Inc. Customer support via social network
US8918388B1 (en) * 2010-02-26 2014-12-23 Turn Inc. Custom data warehouse on top of mapreduce
US9710556B2 (en) * 2010-03-01 2017-07-18 Vcvc Iii Llc Content recommendation based on collections of entities
JP4898934B2 (ja) 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4868191B2 (ja) * 2010-03-29 2012-02-01 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US8645125B2 (en) 2010-03-30 2014-02-04 Evri, Inc. NLP-based systems and methods for providing quotations
US11386510B2 (en) * 2010-08-05 2022-07-12 Thomson Reuters Enterprise Centre Gmbh Method and system for integrating web-based systems with local document processing applications
US9798800B2 (en) * 2010-09-24 2017-10-24 International Business Machines Corporation Providing question and answers with deferred type evaluation using text with limited structure
US8725739B2 (en) 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
WO2013013093A1 (en) * 2011-07-20 2013-01-24 Ness Computing, Inc. Method and apparatus for quickly evaluating entities
US9202176B1 (en) * 2011-08-08 2015-12-01 Gravity.Com, Inc. Entity analysis system
US9158754B2 (en) * 2012-03-29 2015-10-13 The Echo Nest Corporation Named entity extraction from a block of text
JP6111938B2 (ja) * 2013-08-29 2017-04-12 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置
US20150269612A1 (en) * 2014-03-18 2015-09-24 Microsoft Corporation Entity platform and entity store
US10817591B2 (en) * 2014-08-20 2020-10-27 Minin Inc. Systems and methods for mapping licenses data from disparate databases
US20160371618A1 (en) 2015-06-11 2016-12-22 Thomson Reuters Global Resources Risk identification and risk register generation system and engine
US10866992B2 (en) 2016-05-14 2020-12-15 Gratiana Denisa Pol System and methods for identifying, aggregating, and visualizing tested variables and causal relationships from scientific research
US10732993B2 (en) 2018-03-08 2020-08-04 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301530B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301531B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301424B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11308112B2 (en) 2018-03-08 2022-04-19 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
JP7090574B2 (ja) * 2019-03-18 2022-06-24 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム
BR102019008715A2 (pt) * 2019-04-29 2020-11-10 Telefonica Brasil S.A. método de identificação de fraude de endereço em um documento eletrônico de comprovante de residência.
CN113157996B (zh) * 2020-01-23 2022-09-16 久瓴(上海)智能科技有限公司 文档信息处理方法、装置、计算机设备及可读存储介质
US20220180215A1 (en) * 2020-12-08 2022-06-09 Nitin Kumar System and computer network for knowledge search and analysis

Family Cites Families (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3872448A (en) * 1972-12-11 1975-03-18 Community Health Computing Inc Hospital data processing system
US4384288A (en) * 1980-12-31 1983-05-17 Walton Charles A Portable radio frequency emitting identifier
US4799258A (en) 1984-02-13 1989-01-17 National Research Development Corporation Apparatus and methods for granting access to computers
US4575621A (en) * 1984-03-07 1986-03-11 Corpra Research, Inc. Portable electronic transaction device and system therefor
US4817050A (en) * 1985-11-22 1989-03-28 Kabushiki Kaisha Toshiba Database system
US4893270A (en) * 1986-05-12 1990-01-09 American Telephone And Telegraph Company, At&T Bell Laboratories Medical information system
US4887212A (en) 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
DE3823259C2 (de) 1987-07-08 1994-09-01 Toshiba Kawasaki Kk Einrichtung zum Archivieren und Übermitteln von medizinischen Bilddaten
US4864501A (en) 1987-10-07 1989-09-05 Houghton Mifflin Company Word annotation system
US4878175A (en) 1987-11-03 1989-10-31 Emtek Health Care Systems Method for generating patient-specific flowsheets by adding/deleting parameters
US5157783A (en) 1988-02-26 1992-10-20 Wang Laboratories, Inc. Data base system which maintains project query list, desktop list and status of multiple ongoing research projects
US4994966A (en) * 1988-03-31 1991-02-19 Emerson & Stern Associates, Inc. System and method for natural language parsing by initiating processing prior to entry of complete sentences
US5146439A (en) 1989-01-04 1992-09-08 Pitney Bowes Inc. Records management system having dictation/transcription capability
US5408655A (en) * 1989-02-27 1995-04-18 Apple Computer, Inc. User interface system and method for traversing a database
US5842224A (en) 1989-06-16 1998-11-24 Fenner; Peter R. Method and apparatus for source filtering data packets between networks of differing media
US5860136A (en) * 1989-06-16 1999-01-12 Fenner; Peter R. Method and apparatus for use of associated memory with large key spaces
US5418942A (en) * 1989-07-06 1995-05-23 Krawchuk; Kenneth V. System and method for storing and managing information
US5065315A (en) 1989-10-24 1991-11-12 Garcia Angela M System and method for scheduling and reporting patient related services including prioritizing services
US5233513A (en) * 1989-12-28 1993-08-03 Doyle William P Business modeling, software engineering and prototyping method and apparatus
US5253362A (en) 1990-01-29 1993-10-12 Emtek Health Care Systems, Inc. Method for storing, retrieving, and indicating a plurality of annotations in a data cell
US5218697A (en) * 1990-04-18 1993-06-08 Microsoft Corporation Method and system for networking computers having varying file architectures
US5291399A (en) * 1990-07-27 1994-03-01 Executone Information Systems, Inc. Method and apparatus for accessing a portable personal database as for a hospital environment
US5317729A (en) * 1990-10-24 1994-05-31 International Business Machines Corporation Method for the storage of multi-versioned data with retrieval based on searched query
US5204947A (en) * 1990-10-31 1993-04-20 International Business Machines Corporation Application independent (open) hypermedia enablement services
US5297249A (en) * 1990-10-31 1994-03-22 International Business Machines Corporation Hypermedia link marker abstract and search services
US5581460A (en) 1990-11-06 1996-12-03 Kabushiki Kaisha Toshiba Medical diagnostic report forming apparatus capable of attaching image data on report
US5414838A (en) * 1991-06-11 1995-05-09 Logical Information Machine System for extracting historical market information with condition and attributed windows
CA2066559A1 (en) * 1991-07-29 1993-01-30 Walter S. Rosenbaum Non-text object storage and retrieval
US5377323A (en) 1991-09-13 1994-12-27 Sun Microsytems, Inc. Apparatus and method for a federated naming system which can resolve a composite name composed of names from any number of disparate naming systems
US5265065A (en) 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
JP3300391B2 (ja) * 1991-10-11 2002-07-08 株式会社東芝 画像処理装置
US5283884A (en) * 1991-12-30 1994-02-01 International Business Machines Corporation CKD channel with predictive track table
US5490250A (en) * 1991-12-31 1996-02-06 Amdahl Corporation Method and apparatus for transferring indication of control error into data path of data switcher
US5361346A (en) 1992-01-15 1994-11-01 Santa Monica Pioneer Research Inc. Portable tester (qualifier) for evaluating and testing SCSI interface magnetic disc drives in accordance with ANSI SCSI-A and SCSI-2 definitions
US5434974A (en) * 1992-03-30 1995-07-18 International Business Machines Corporation Name resolution for a multisystem network
US5319711A (en) * 1992-08-19 1994-06-07 Gte Laboratories Incorporated Wireless device for verifying identification
US5515534A (en) * 1992-09-29 1996-05-07 At&T Corp. Method of translating free-format data records into a normalized format based on weighted attribute variants
US5459860A (en) 1992-10-05 1995-10-17 International Business Machines Corporation Computerized system and process for managing a distributed database system
US5558638A (en) 1993-04-30 1996-09-24 Healthdyne, Inc. Patient monitor and support system
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US5361202A (en) 1993-06-18 1994-11-01 Hewlett-Packard Company Computer display system and method for facilitating access to patient data records in a medical information system
US5506984A (en) * 1993-06-30 1996-04-09 Digital Equipment Corporation Method and system for data retrieval in a distributed system using linked location references on a plurality of nodes
US5438655A (en) * 1993-07-29 1995-08-01 Hewlett-Packard Company Methods and apparatus for updating and antialiasing waveforms
US5477215A (en) * 1993-08-02 1995-12-19 At&T Corp. Arrangement for simultaneously interrogating a plurality of portable radio frequency communication devices
US5806079A (en) 1993-11-19 1998-09-08 Smartpatents, Inc. System, method, and computer program product for using intelligent notes to organize, link, and manipulate disparate data objects
US5497317A (en) * 1993-12-28 1996-03-05 Thomson Trading Services, Inc. Device and method for improving the speed and reliability of security trade settlements
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
US5560005A (en) 1994-02-25 1996-09-24 Actamed Corp. Methods and systems for object-based relational distributed databases
US6141663A (en) 1994-03-18 2000-10-31 Unimax Systems Corporation Automatic external data synchronization method
DE69408439T2 (de) * 1994-03-22 1998-09-17 Agfa Gevaert Nv Verfahren zur Identifizierung eines Strahlungsbildes
CA2125300C (en) * 1994-05-11 1999-10-12 Douglas J. Ballantyne Method and apparatus for the electronic distribution of medical information and patient services
US5557539A (en) 1994-06-13 1996-09-17 Centigram Communications Corporation Apparatus and method for testing an interactive voice messaging system
US5608900A (en) * 1994-06-21 1997-03-04 Internationl Business Machines Corp. Generation and storage of connections between objects in a computer network
US5535372A (en) * 1994-07-06 1996-07-09 International Business Machines Corporation Method and apparatus for efficient updating of CKD data stored on fixed block architecture devices
US5623652A (en) 1994-07-25 1997-04-22 Apple Computer, Inc. Method and apparatus for searching for information in a network and for controlling the display of searchable information on display devices in the network
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process
US5629981A (en) * 1994-07-29 1997-05-13 Texas Instruments Incorporated Information management and security system
US5603025A (en) * 1994-07-29 1997-02-11 Borland International, Inc. Methods for hypertext reporting in a relational database management system
US5715445A (en) * 1994-09-02 1998-02-03 Wolfe; Mark A. Document retrieval system employing a preloading procedure
US5659676A (en) * 1994-09-20 1997-08-19 International Business Machines Corporation Systems and methods for creating and refreshing compound documents
WO1996015505A2 (en) 1994-11-08 1996-05-23 Vermeer Technologies, Inc. An online service development tool with fee setting capabilities
US5617565A (en) * 1994-11-29 1997-04-01 Hitachi America, Ltd. Broadcast interactive multimedia system
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
GB9426165D0 (en) 1994-12-23 1995-02-22 Anthony Andre C Method of retrieving and displaying data
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US5873077A (en) * 1995-01-13 1999-02-16 Ricoh Corporation Method and apparatus for searching for and retrieving documents using a facsimile machine
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5963205A (en) 1995-05-26 1999-10-05 Iconovex Corporation Automatic index creation for a word processor
US5664109A (en) * 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US5870770A (en) * 1995-06-07 1999-02-09 Wolfe; Mark A. Document research system and method for displaying citing documents
JP3700733B2 (ja) * 1995-06-12 2005-09-28 富士ゼロックス株式会社 文書管理装置及び文書管理方法
US5740549A (en) * 1995-06-12 1998-04-14 Pointcast, Inc. Information and advertising distribution system and method
US5878421A (en) * 1995-07-17 1999-03-02 Microsoft Corporation Information map
US5860073A (en) * 1995-07-17 1999-01-12 Microsoft Corporation Style sheets for publishing system
US5644720A (en) * 1995-07-31 1997-07-01 West Publishing Company Interprocess communications interface for managing transaction requests
US5942986A (en) * 1995-08-09 1999-08-24 Cedars-Sinai Medical Center System and method for automatic critical event notification
US5745360A (en) * 1995-08-14 1998-04-28 International Business Machines Corp. Dynamic hypertext link converter system and process
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5963940A (en) 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US5740252A (en) * 1995-10-13 1998-04-14 C/Net, Inc. Apparatus and method for passing private demographic information between hyperlink destinations
US5764906A (en) * 1995-11-07 1998-06-09 Netword Llc Universal electronic resource denotation, request and delivery system
US5822539A (en) 1995-12-08 1998-10-13 Sun Microsystems, Inc. System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server
US5754857A (en) * 1995-12-08 1998-05-19 Sun Microsystems, Inc. Distributed asynchronous workflow on the net
US5781900A (en) * 1996-01-02 1998-07-14 Sofmap Future Design, Inc. Flexible hyperlink association system
US5751961A (en) * 1996-01-31 1998-05-12 Bell Communications Research, Inc. Integrated internet system for translating logical addresses of internet documents to physical addresses using integrated service control point
US5862325A (en) * 1996-02-29 1999-01-19 Intermind Corporation Computer-based communication system and method using metadata defining a control structure
US5745908A (en) * 1996-03-29 1998-04-28 Systems Focus International Method for converting a word processing file containing markup language tags and conventional computer code
US5867562A (en) * 1996-04-17 1999-02-02 Scherer; Gordon F. Call processing system with call screening
US5905866A (en) * 1996-04-30 1999-05-18 A.I. Soft Corporation Data-update monitoring in communications network
WO1997044726A1 (en) * 1996-05-06 1997-11-27 Adobe Systems Incorporated Internet hyperlink drag and drop
DE69719858T2 (de) 1996-05-13 2003-12-24 Oki Electric Ind Co Ltd Dokumentanzeigesystem und elektronisches Wörterbuch
US5794236A (en) 1996-05-29 1998-08-11 Lexis-Nexis Computer-based system for classifying documents into a hierarchy and linking the classifications to the hierarchy
US5742181A (en) * 1996-06-04 1998-04-21 Hewlett-Packard Co. FPGA with hierarchical interconnect structure and hyperlinks
US5724595A (en) * 1996-06-19 1998-03-03 Sun Microsystems, Inc. Simple method for creating hypertext links
US5907680A (en) 1996-06-24 1999-05-25 Sun Microsystems, Inc. Client-side, server-side and collaborative spell check of URL's
US5963950A (en) 1996-06-26 1999-10-05 Sun Microsystems, Inc. Method and system for facilitating access to selectable elements on a graphical user interface
US5761436A (en) * 1996-07-01 1998-06-02 Sun Microsystems, Inc. Method and apparatus for combining truncated hyperlinks to form a hyperlink aggregate
US6272505B1 (en) * 1998-07-07 2001-08-07 Carlos De La Huerga Document modification based hyperlink limiting method and apparatus
US5895461A (en) * 1996-07-30 1999-04-20 Telaric, Inc. Method and system for automated data storage and retrieval with uniform addressing scheme
US6516321B1 (en) * 1996-07-30 2003-02-04 Carlos De La Huerga Method for database address specification
US6308171B1 (en) 1996-07-30 2001-10-23 Carlos De La Huerga Method and system for automated data storage and retrieval
US6345268B1 (en) * 1997-06-09 2002-02-05 Carlos De La Huerga Method and system for resolving temporal descriptors of data records in a computer system
US5903889A (en) * 1997-06-09 1999-05-11 Telaric, Inc. System and method for translating, collecting and archiving patient records
US6434567B1 (en) 1996-07-30 2002-08-13 Carlos De La Huerga Method for specifying enterprise-wide database address formats
US6353822B1 (en) * 1996-08-22 2002-03-05 Massachusetts Institute Of Technology Program-listing appendix
JP3773602B2 (ja) 1996-09-18 2006-05-10 株式会社東芝 ハイパーテキスト処理装置及びその方法
US5764916A (en) * 1996-09-27 1998-06-09 Ichat, Inc. Method and apparatus for real time communication over a computer network
US6037944A (en) * 1996-11-07 2000-03-14 Natrificial Llc Method and apparatus for displaying a thought network from a thought's perspective
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6216141B1 (en) * 1996-12-06 2001-04-10 Microsoft Corporation System and method for integrating a document into a desktop window on a client computer
EP0848337A1 (en) 1996-12-12 1998-06-17 SONY DEUTSCHLAND GmbH Server with automatic document assembly
JPH10228473A (ja) * 1997-02-13 1998-08-25 Ricoh Co Ltd 文書画像処理方法、文書画像処理装置および記憶媒体
US5875446A (en) * 1997-02-24 1999-02-23 International Business Machines Corporation System and method for hierarchically grouping and ranking a set of objects in a query context based on one or more relationships
US5973692A (en) * 1997-03-10 1999-10-26 Knowlton; Kenneth Charles System for the capture and indexing of graphical representations of files, information sources and the like
US5970505A (en) 1997-03-31 1999-10-19 Sun Mirosystems, Inc. Linking related data in a document set including a plurality of books written by different groups of authors in a computer network
US6038573A (en) * 1997-04-04 2000-03-14 Avid Technology, Inc. News story markup language and system and process for editing and processing documents
US5987454A (en) 1997-06-09 1999-11-16 Hobbs; Allen Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource
US6025844A (en) * 1997-06-12 2000-02-15 Netscape Communications Corporation Method and system for creating dynamic link views
US5974413A (en) 1997-07-03 1999-10-26 Activeword Systems, Inc. Semantic user interface
US5905991A (en) * 1997-08-21 1999-05-18 Reynolds; Mark L System and method providing navigation between documents by creating associations based on bridges between combinations of document elements and software
US6356922B1 (en) * 1997-09-15 2002-03-12 Fuji Xerox Co., Ltd. Method and system for suggesting related documents
US6091412A (en) * 1997-09-30 2000-07-18 The United States Of America As Represented By The Secretary Of The Navy Universal client device permitting a computer to receive and display information from several special applications
US6256631B1 (en) * 1997-09-30 2001-07-03 International Business Machines Corporation Automatic creation of hyperlinks
US6094657A (en) * 1997-10-01 2000-07-25 International Business Machines Corporation Apparatus and method for dynamic meta-tagging of compound documents
US5940843A (en) * 1997-10-08 1999-08-17 Multex Systems, Inc. Information delivery system and method including restriction processing
US6014662A (en) * 1997-11-26 2000-01-11 International Business Machines Corporation Configurable briefing presentations of search results on a graphical interface
US6094649A (en) * 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
US6067565A (en) * 1998-01-15 2000-05-23 Microsoft Corporation Technique for prefetching a web page of potential future interest in lieu of continuing a current information download
US6085226A (en) * 1998-01-15 2000-07-04 Microsoft Corporation Method and apparatus for utility-directed prefetching of web pages into local cache using continual computation and user models
US6151624A (en) 1998-02-03 2000-11-21 Realnames Corporation Navigating network resources based on metadata
US6092074A (en) * 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
US6038574A (en) * 1998-03-18 2000-03-14 Xerox Corporation Method and apparatus for clustering a collection of linked documents using co-citation analysis
US6457028B1 (en) 1998-03-18 2002-09-24 Xerox Corporation Method and apparatus for finding related collections of linked documents using co-citation analysis
US6122647A (en) * 1998-05-19 2000-09-19 Perspecta, Inc. Dynamic generation of contextual links in hypertext documents
US6205576B1 (en) * 1998-06-05 2001-03-20 Nortel Networks Limited Method and apparatus for identifying indirect messaging relationships between software entities
US6263121B1 (en) * 1998-09-16 2001-07-17 Canon Kabushiki Kaisha Archival and retrieval of similar documents
US7003719B1 (en) * 1999-01-25 2006-02-21 West Publishing Company, Dba West Group System, method, and software for inserting hyperlinks into documents
US6341306B1 (en) * 1999-08-13 2002-01-22 Atomica Corporation Web-based information retrieval responsive to displayed word identified by a text-grabbing algorithm
US6507837B1 (en) * 2000-06-08 2003-01-14 Hyperphrase Technologies, Llc Tiered and content based database searching
US6654758B1 (en) 2000-07-21 2003-11-25 Unisys Corporation Method for searching multiple file types on a CD ROM
TW548557B (en) * 2000-09-13 2003-08-21 Intumit Inc A method and system for electronic document to have fast-search category and mutual link
AU2002224333A1 (en) * 2000-09-20 2002-04-02 A2I, Inc. Method and apparatus for structuring, maintaining, and using families of data
US20030041305A1 (en) * 2001-07-18 2003-02-27 Christoph Schnelle Resilient data links
US7333966B2 (en) 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
KR100856771B1 (ko) * 2001-12-28 2008-09-05 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징
NZ548804A (en) * 2003-12-31 2008-11-28 Thomson Global Resources Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories

Also Published As

Publication number Publication date
CA2553196A1 (en) 2005-07-21
NZ548804A (en) 2008-11-28
JP2007522543A (ja) 2007-08-09
EP1704497B1 (en) 2012-03-28
CN100472520C (zh) 2009-03-25
EP1704497A1 (en) 2006-09-27
BRPI0506673A (pt) 2007-05-15
AR047362A1 (es) 2006-01-18
ATE551658T1 (de) 2012-04-15
HK1104101A1 (en) 2008-01-04
US20100121889A1 (en) 2010-05-13
US7571174B2 (en) 2009-08-04
AU2005204147A1 (en) 2005-07-21
AU2005204147A2 (en) 2005-07-21
EP2270688A1 (en) 2011-01-05
JP2012043469A (ja) 2012-03-01
JP4919487B2 (ja) 2012-04-18
JP5670294B2 (ja) 2015-02-18
US20050234968A1 (en) 2005-10-20
US8001129B2 (en) 2011-08-16
WO2005066848A1 (en) 2005-07-21
CN1934567A (zh) 2007-03-21
CA2553196C (en) 2013-03-19

Similar Documents

Publication Publication Date Title
ES2388817T3 (es) Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea
WO2008052068A2 (en) A system and method for secure, anonymous, and pertinent reposting of private blog posting, etc.
Lossio Ventura et al. Biomedical terminology extraction: A new combination of statistical and web mining approaches
Feldman Subject librarians in the changing academic library
Aboud et al. Querying a hypertext information retrieval system by the use of classification
Dozier et al. Creation of an expert witness database through text mining
AU2011204902B2 (en) Systems, Methods, Interfaces And Software For Automated Collection And Integration Of Entity Data Into Online Databases And Professional Directories
Gil-Leiva The indexing at the Internet
Cupar et al. Ethical considerations and social responsibility in library catalogues
Rambo et al. Knowledge-based information and systems
HYVÖNEN Knowledge-based Approach to Relational Search in Knowledge Graphs with Explanations: Case BiographySampo–Biographies on the Semantic Web
Mahmoudi Semantically Enriching Geodata
Osmani Information Source Detection and Anti-Plagiarism System
Hanson Personal bibliographic software and the provision of computer‐based information services in academic communities
Shahaf Automatic Generation of Issue Maps: Structured, Interactive Outputs for Complex Information Needs
Leone et al. A Phrase-based Ontology Enabled Semantic Processing System for Web Search
Bril et al. Open Source Information Collection, Processing and Applications
Tiscornia Mapping a Formal Ontology onto a Legal Ontology
Chen Searching for information on occupational accidents
Lomax Finding and evaluating medical and health information on the Internet: A Beginner's reference
Corbett et al. The Veteran MEDLINE Searcher's Encounter with Other Databases
Palmquist et al. Visual maps of the world wide web: helping the user find the way
Beal et al. Harnessing user communities for website location and evaluation
Zimmer Sponsoring Committee: Professor Helen Nissenbaum, Chairperson Professor Alex Galloway Professor Siva Vaidhyanathan
Chen Image Retrieval Knowledge and Art History Curriculum in the Digital Age