MXPA04006378A - Metodo y aparato para la deteccion automatica de tipos de datos para el procesamiento dependiente del tipo de datos. - Google Patents
Metodo y aparato para la deteccion automatica de tipos de datos para el procesamiento dependiente del tipo de datos.Info
- Publication number
- MXPA04006378A MXPA04006378A MXPA04006378A MXPA04006378A MXPA04006378A MX PA04006378 A MXPA04006378 A MX PA04006378A MX PA04006378 A MXPA04006378 A MX PA04006378A MX PA04006378 A MXPA04006378 A MX PA04006378A MX PA04006378 A MXPA04006378 A MX PA04006378A
- Authority
- MX
- Mexico
- Prior art keywords
- data
- metadata
- format
- essence
- link
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Se describe un metodo para la deteccion automatica para el tipo de datos para el procesamiento dependiente de tipo de datos, que tiene dos sistemas de clasificacion ortogonales definidos, y determina para los items de datos que entran, un tipo de dato de acuerdo al primer sistema de clasificacion, y otro tipo de dato de acuerdo al segundo sistema de clasificacion comprende los tipos de datos Esencia (e), Metadato (M) y Recipiente (C). El segundo sistema de clasificacion comprende los tipos de datos Dato Fisico (PD) y Dato Abstracto (AD). El tipo de dato por omision puede ser definido para los times de datos que no son clasificables de manera unica. Ventajosamente, el metodo de la invencion puede ser utilizado cuando diferentes clases de times de datos requieren diferentes metodos para el procesamiento, por ejemplo la busqueda del contenido.
Description
Patente Europea (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB. Para los códigos de dos letras y otras abreviaturas, referirse a las GR, IE, IT, LU, MC, NL, PT, SE, TR), Patente OAPI (BF, Bl "Notas de Guia sobre los Códigos y Abreviaturas " que aparecen al CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD. comienzo de cada emisión regular de la Gaceta del PCT. TG). Publicada Con reporte de búsqueda internacional.
1
METODO Y APARATO PARA LA DETECCION AUTOMÁTICA DE TIPOS DE DATOS PARA EL PROCESAMIENTO DEPENDIENTE DEL TIPO DE DATOS
La invención ser refiere a un método y a un aparato para la clasificación, organización y estructuración de diferentes tipos de datos, que puede ser utilizada, por ejemplo para clasificar datos, almacenar datos o recuperar datos.
ANTECEDENTES DE LA INVENCION
La capacidad de los medios de almacenamiento digitales como los discos duros o discos ópticos reescribibles para la grabación personal de video y otros datos, se desarrolla continuamente. Esto da como resultado nuevos conceptos como, por ejemplo, el denominado servidor doméstico, el cual es un dispositivo de almacenamiento central con capacidad grande para grabar cualquier tipo de datos dentro del hogar. Tales aplicaciones también requieren nuevas formas para organizar los datos grabados, la búsqueda para el contenido y el acceso a los registros o grabaciones especificas. Para este propósito pueden ser utilizados datos respecto a datos, frecuentemente denominados como 2
metadatos. Diversos grupos industriales y cuerpos estándares han estado desarrollando estándares de metadatos para diferentes propósitos y aplicaciones. En aplicaciones de medios múltiples (multimedia) , los metadatos típicamente son datos respecto a los datos audiovisuales (AV) , estos datos AV frecuentemente son llamados 'esencia' . No obstante, Sistema de Manejo de Base de Datos (DBMS) que será capaz de manejar datos de diversos tipos de datos requiere correctamente una definición de los tipos de datos, y un método para distinguir entre ellos.
Invención
La invención está basada en el reconocimiento de los hechos descritos en lo siguiente: En dispositivos que proporcionan un DBMS para el manejo de datos de entrada, incluyendo los metadatos de entrada, es necesario clasificar dichos datos de entrada, y especialmente metadatos de entrada, ya que es necesario un procesamiento diferente para diferentes tipos de metadatos. Por ejemplo, una búsqueda de texto no es adecuada para los metadatos que contienen una imagen en el Formato de Intercambio de Gráficos (GIF) bien conocido.
3
El problema que va a ser resuelto por la invención es clasificar los datos automáticamente, tal que un DBMS puede utilizar el resultado de la clasificación para el manejo correcto de datos. Este problema es resuelto por el método descrito en la reivindicación 1 y por el aparato descrito en la reivindicación 5. La salida de tal aparato puede ser dirigida hacia, por ejemplo un DBMS. De acuerdo a la invención, los metadatos pueden ser definidos como grupos de datos que consisten de dos partes, a saber una primera parte que es un enlace, el enlace señala hacia un grupo de datos de referencia, y una segunda parte que es cualquier dato referente a dicho enlace. En lo subsiguiente, la primera parte es denominada como MD_LINK, y la segunda parte es denominada como D^LOAD. Cualquier ítem de datos que no contenga al menos un MD_LINK y un MD_LOAD relacionado, es definido como Esencia. Los metadatos frecuentemente aparecen junto con otros Metadatos o Esencia, combinados en una entidad lógica, por ejemplo como un archivo sobre un disco duro. Tal mezcla de diferentes tipos de Esencia y Metadatos es en lo siguiente llamada 'Recipiente' . Los ejemplos populares para tales Recipientes son los archivos .de Lenguaje de Marcación de Hipertexto (HTML), o los archivos de 4
Formato de Documento Portátil (PDF) . Además, de acuerdo a la invención existe otro tipo de clasificación posible. Los datos pueden requerir la interpretación a través del dispositivo antes de que éstos puedan ser utilizados. · En este caso, los datos son definidos como Datos Físicos, si el dispositivo tiene un método para interpretación definida, de otro modo datos abstractos. Por ejemplo, si una imagen es almacenada en el formato GIF, y el dispositivo puede interpretar el formato GIF y mostrarlo visualmente como una imagen, éste es clasificado como Dato Físico. Si el dispositivo no puede interpretar el formato GIF, el dato e.s clasificado como Dato Abstracto. Ejemplos adicionales para Datos Abstractos son archivos de texto, y otros archivos que no pueden ser interpretados a través del dispositivo. Los dos tipos previamente definidos de clasificación no son exclusivos, sino que se complementan uno con el otro. Además, la clasificación descrita de datos no es absoluta, pero es dependiente del sistema, y por lo tanto únicamente localmente relevante . Ventajosamente, esta clasificación permite que el dispositivo maneje diferentes tipos de datos 5
correctamente, difieran entre Metadatos, Esencia, Recipiente, Datos Físicos y Datos Abstractos, y de este modo permiten un método de acceso generalizado sobre dichos tipos de datos. Con este conocimiento, el dispositivo puede decidir, por ejemplo cuál tipo de búsqueda de datos utilizar, cómo interpretar los datos, y si algunos datos pueden ser omitidos para una cierta búsqueda . Las modalidades adicionales ventajosas de la invención son descritas en el siguiente texto, y en las reivindicaciones dependientes respectivas.
Dibu os
Modalidades ejemplares de la invención se describen con referencia a los dibujos anexos, los cuales muestran en: Figura 1 los dos sistemas, o dimensiones de clasificación de datos; Figura 2 un ejemplo para un Recipiente que contiene Esencia y Metadatos ; Figura 3 un ejemplo para Metadatos abstractos. Figura 4 un ejemplo para Metadatos Físicos, y Figura 5 un diagrama de flujo ejemplar para el método de acuerdo a la invención.
6
Modalidades Ejemplares
De acuerdo a la invención, los dos tipos, o sistemas, de clasificación pueden ser entendidos como dos dimensiones, como se muestra en la Figura 1. Un ítem de datos puede ser ya sea Esencia E o Metadatos M, y Dato Físico PD o Dato Abstracto AD. Por lo tanto, los posibles tipos de datos son Esencia Física PE, Metadatos Físicos PM, Esencia Abstracta AE o Metadato Abstracto AM . Además, un ítem de dato puede también ser un Recipiente C, si éste contiene otros ítems de datos . La clasificación de datos no es absoluta, sino que es subjetiva desde el punto de vista del dispositivo, y por lo tanto únicamente relevante dentro de un sistema, por ejemplo DBMS. Puede suceder que, por ejemplo un sistema puede interpretar un enlace mientras que otro sistema no puede interpretar el mismo enlace. Por lo tanto, puede suceder que, por ejemplo, un sistema clasifique ciertos datos como Metadatos, consistiendo de MD_LOAD y MD_LINK, mientras que otro sistema clasifique los mismos datos como Esencia, debido a que éste no puede interpretar el enlace. Otro ejemplo más es que, por ejemplo un sistema puede 7
reproducir una capa de audio MPEG 3, o MP3, archivo codificado, mientras que otro sistema más no puede interpretar el formato MP3. En este caso, el primer sistema clasifica un archivo codificado MP3 como Dato Físico, pero el segundo sistema clasifica el mismo archivo como Dato Abstracto. El texto va a ser considerado como Dato Abstracto, debido a que el texto es siempre un formato para ahorrar datos. El texto formateado puede representar una representación física directa de los datos, por ejemplo el formato PDF. La información del formato representa únicamente la información de apoyo, por ejemplo si la información de formato es extraída de un archivo PDF, el texto puro que es la información principal, permanecerá. Si el texto es extraído, la información principal se perderá. Debido al hecho de que el texto representa la información principal, también el texto formateado será considerado como Dato Abstracto . Un dispositivo como se describe en la reivindicación 5 ejecutará el siguiente procedimiento cuando reciba datos en su entrada: Si los datos contienen más de un ítem de datos, la señal de salida puede ser: "El Dato es un
Recipiente". Más detalles se dan más adelante.
La clasificación puede detenerse aquí, o puede ser extendida hasta algo, o toda, hojas del árbol de datos jerárquicamente estructurados, dentro del Recipiente . Si los datos son Metadatos, la salida puede ser: "Datos son Metadatos". De otro modo, la salida puede ser "Datos son Esencia" . Si los da:os son Datos Físicos, una salida adicional puede ser "Datos son Datos Físicos". De otro modo, si los datos son Datos Abstractos, una salida adicional puede ser "Datos son Datos
Abstractos". Ventajosamente, el dispositivo puede detectar y enviar de salida el tipo de Dato Físico, por ejemplo "El dato es una imagen de color (24 bitios) con la resolución de x=200 pixeles e y=400 pixeles". Si el formato de datos es desconocido para el dispositivo, y por lo tanto el dispositivo no es capaz de clasificar los datos como Recipiente, Metadato, Esencia, Dato Abstracto o Dato Físico, la salida puede ser cualquier salida del tipo por omisión, por ejemplo "el tipo de Datos desconocido" o "los Datos son Esencia y Datos Abstractos" .
9
Adicí onalmente , es de auxilio si el dispositivo detecta si el dato es texto o no: Si el dato es Dato Abstracto y Texto, la salida puede ser adicionalmente "el Dato es Texto". Esto puede ser implementado mediante la búsqueda de palabras conocidas, por ejemplo a partir de un diccionario electrónico o buscando grupos de caracteres separados por espacios en blanco. Si el dato de entrada es un Recipiente, una salida adicional puede ser "Dato es un Recipiente, por ejemplo más metadatos o esencia están contenidos". Opc iona luiente , pueden ser incluidos detalles precisos: "El Recipiente CONTIENE al menos 1 etadato y 1 Esencia", o "El Recipiente NO CONTIENE Metadatos del todo" o incluso "El Recipiente CONTIENE exactamente N ítems de Metadatos", con N que es la cantidad de Metadatos contenidos en el Recipiente. Si el dispositivo puede detectar el formato de los datos analizados, éste puede enviarlos de salida adicionalmente : "el formato de Datos es X", X' es el formato. Los ejemplos para ??' pueden ser por ejemplo 'HTML' o 'JPEG' . La Figura 2 muestra un ejemplo para un archivo de datos que contiene una combinación de Esencia y Metadato en el formato HTML bien conocido. En lo 10
subsiguiente, se describe la clasificación de todos los elementos de acuerdo a la invención. Primeramente, el dispositivo detecta que la primera linea es <html>, y que por lo tanto el archivo de datos debe ser formateado como HTML. Se asume que el dispositivo puede interpretar el formato HTML, y por lo tanto interpreta los ítems con atributos "href ." en los archivos HTML como enlaces. Ya que los archivos formateados en HTML usualmente contienen una estructura jerárquica, los elementos de hoja del árbol jerárquico son primeramente analizados. El primer elemento de la Figura 2 <titulo>Este es el título</título> es clasificado como Esencia debido a que no existe enlace vinculado al elemento.
El elemento <a href=http : //www. w3c . org>W3C HOME</a> es clasificado como Metadato, con la serie "W3C HOME" que es la Esencia, o MD^LOAD, y la serie "href . =http : //w3c. org" que es el enlace relacionado, o MD LINK.
El siguiente elemento de hoja Este es un párrafo</p> no contiene enlace y por lo tanto es clasificado como 11
Esencia . El siguiente elemento de hoja <img src="image.gif"> es también clasificado como Esencia debido a que éste es únicamente un enlace, por ejemplo éste no contiene MD_LINK con MD_LOAD relacionado. Por lo tanto, éste no puede ser etadato. El propósito de este enlace es referirse adicionalmente a Esencia, a saber el dato de imagen . Cuando todos los elementos del primer nivel de jerarquía son analizados, el siguiente nivel es investigado. El elemento <cabeza> <título>Este es el tí ulo</tí tulo> </cabeza> es clasificado como Esencia debido a que éste no contiene enlace, sino únicamente un elemento, el elemento que es Esencia.
El elemento <a href=http : / /www . w3c . org> <img src="image . gif "> </a> es clasificado como Metadato, con <img src="image . gif "> que es la parte ce MD_L0AD y el atributo "href" que es 12
el enlace relacionado. El siguiente elemento <cuerpo>
</cuerpo> es clasificado como Recipiente debido a que éste agrupa conjuntamente ítems de Metadatos e ítems de Esencia.
Finalmente, el elemento <html>
</html> es también clasificado como Recipiente. Este agrupa conjuntamente un elemento de Esencia, a saber el elemento <cabeza>, y un Recipiente, a saber el elemento <cuerpo> . La Figura 3 muestra un ejemplo para los Metadatos Abstractos. Varios ítems de datos 3R, 3M son agrupados en una unidad de datos 3C. La unidad de datos 3C podría ser, por ejemplo un archivo HTML. Para uno de dichos ítems de datos el dispositivo ha detectado que éste contiene un enlace 3L, simbolizado por el cursor que cambia de una flecha a una mano cuando señala al texto 3E . Mientras que el texto 3E y el enlace 3L pertenecen conjuntamente, y el texto 3E es 13
Esencia, éstos forman un ítem 3M de Metadato, y el enlace 3L es un enlace de Metadato que señala hacia una referencia 3REF fuera de la unidad de datos 3C. Ya que la Esencia 3E del ítem de Metadatos 3M es texto, y el texto es Datos Abstractos, el ítem 3M de Metadatos es un ítem de Metadatos Abstractos. Los ítems de datos 3R remanentes dentro de la unidad de datos 3C son. cualquiera de texto y una imagen. La unidad de datos 3C es un Recipiente, ya que éste contiene al menos un ítem 3M de Metadatos y el otro ítem de datos remanentes 3R. La Figura 4 muestra un ejemplo para los Metadatos Físicos. Varios ítems de datos 4R,4M están contenidos en una unidad de datos 4C, la unidad 4C es, por ejemplo un archivo HTML. En este caso, el dispositivo ha detectado que la imagen 4E está asociada a un enlace 4L, simbolizada por el curso que cambia de una flecha a una mano. El enlace 4L está señalando a una referencia 4REF fuera de la unidad de datos 4C. Ya que la imagen 4E y el enlace 4L pertenecen conjuntamente, éstos forman un ítem de Metadatos 4M, con la imagen 4E que es la Esencia de este Metadato. Dicha Esencia 4E es, por ejemplo, una imagen formateada en JPEG, y en el archivo HTML éste puede ser referido por ejemplo como <img sr c=Anton . j pg anchura=108 14
altura=73>. Ya que el dispositivo puede mostrarlo, éste es Dato Físico, y el ítem 4M de Metadato es Metadato Físico. La unidad de datos 4C es un recipiente, debido a que ésta contiene al menos un ítem de Metadato 4M y los otros ítems 4R. La Figura 5 muestra un diagrama de flujo ejemplar del método de la invención. El propósito de la invención es clasificar diferentes tipos de datos entrantes IN. Los datos entrantes IN están siendo analizados, y un primer bloque de decisión DI decide si el formato de los datos entrantes puede ser detectado o no. Si no es así, 'Desconocido' es indicado como una señal de salida, y la clasificación termina en un estado de fin EX. Si el formato- es conocido, por ejemplo HTML, entonces un segundo bloque de decisión D2 puede decidir si el dato entrante contiene elementos no clasificados. Si la respuesta es 'Si' , el siguiente ítem de datos no clasificados es recogido y enviado a un tercer bloque de decisión D3. Este bloque de decisión D3 puede decidir si dicho ítem de datos es un Recipiente C, Metadato M o Esencia E. La decisión es 'Recipiente' si el ítem de datos contiene otro ítem de datos ya clasificado como Metadato. La decisión es 'Metadato' si el ítem de datos contiene un enlace con esencia relacionada a ese enlace. En todos los otros 15
casos la decisión es 'Esencia' . La decisión realizada en el tercer bloque de decisión D3 es indicado en la salida. Si el ítem de dato analizado es un Recipiente C, entonces el procedimiento regresa al segundo bloque de decisión D2 nuevamente, de otro modo es introducido un cuarto bloque de decisión D4. Dicho cuarto bloque de decisión D decide si el dispositivo puede interpretar o no el ítem de datos, tal que éste pueda describir la información adicional para el usuario, por ejemplo una imagen mostrable usualmente. Si la respuesta es 'Si', se indica en la salida que dicho ítem de datos es Dato Físico PD, de otro modo el Dato Abstracto AD . En el caso del ítem de datos que es Dato Físico PD, la detección del formato puede haber sido realizada implícitamente en el cuarto bloque de decisión D4. Luego un quinto bloque de decisión D5 puede detectar los detalles del formato y decidir si el formato detectado será indicado, y si es así, el formato F1, ...,F3 puede ser indicado en la salida. En el caso de que el ítem de datos sea el Dato Abstracto AD, un sexto bloque de decisión D6 puede decidir si el dato contiene texto. Si es así, esto es indicado en la señal de salida. Si el ítem de datos es Dato Abstracto AD y no texto, no es generada ninguna indicación adicional. Entonces el procedimiento es repetido desde 16
el segundo bloque de decisión D2 que decide si están contenidos elementos no clasificados adicionales. Si este no es el caso, entonces el ítem de datos ha sido clasificado completamente y el estado final EX es introducido. Esta modalidad de la invención analiza todos los niveles de jerarquía y niveles de hoja de los Recipientes, pero otras modalidades pueden analizar únicamente algunos niveles de jerarquía o elementos de hoja de los Recipientes. Ventajosamente, el método descrito para la clasificación de datos puede ser utilizado en dispositivos para clasificación de datos, almacenamiento de datos, por ejemplo DBMS, o recuperación de datos, por ejemplo buscadores. El método descrito puede ser utilizado cuando diferentes clases de datos requieren diferente procesamiento, por ejemplo diferentes algoritmos de búsqueda, diferentes métodos o áreas de almacenamiento, diferentes métodos de compresión o diferentes métodos de presentación. La invención puede ser implementada en un dispositivo separado, el cual clasificará los datos entrantes con respecto a su formato, contenido, y relación a otros datos, por ejemplo enlace, y el cual proporciona información respecto a los datos. Esta información es especialmente necesaria cuando es para 17
reconocer si estos datos contienen enlaces o estos datos necesitan métodos de búsqueda especiales. El dispositivo puede ser parte de otro dispositivo o puede ser realizado como hardware o software, por ejemplo como una aplicación o un enchufe en una PC. Además, esto puede ser actualizado, por ejemplo vía la Internet o vía otras fuentes, de modo que pueden ser reproducidos más o menos formatos, de este modo este dispositivo se actualizará a si mismo y se volverá más y más eficiente.
Claims (5)
1 . Método para la detección automática de tipos de datos para el procesamiento dependiente del tipo de datos, por un dispositivo técnico, caracterizado porque: a) se reciben datos de diferentes tipos de datos; b) se analizan los datos recibidos, c) se detecta el formato de los datos recibidos, d) se utiliza el formato detectado para evaluar si los datos contienen: - al menos un enlace interpretable en máquina y los datos asociados; - cualquier otro , dato, por ejemplo texto, datos de imagen, enlaces, excepto datos del primer tipo, o - una mezcla de enlace interpretable en máquina y datos asociados con el otro dato; e) se evalúa si el dispositivo técnico es capaz de interpretar los datos para reproducir una representación física de los datos; y f) se suministra el resultado de la primera evaluación y el resultado de la segunda evaluación hacia un dispositivo o proceso para el procesamiento dependiente del tipo de datos, de dichos datos .
2. Método según la reivindicación 1, en donde para el dato que es interpretable por el dispositivo técnico, es también indicado si el tipo de 19 formato de dato es o no uno de un número de tipos de formato especificado.
3. Método según cualquiera de las reivindicaciones 1 a 2, en donde para los datos que no son interpretables por el dispositivo técnico, se indica también si éste es texto.
4. Método según cualquiera de las reivindicaciones 1 a 3, en donde el dispositivo técnico es un dispositivo de clasificación de datos, un sistema de manejo de base de datos o un buscador de contenido de datos .
5. Aparato para la detección automática de tipos de datos para el procesamiento dependiente del tipo de datos, caracterizado porque se utiliza el método según cualquiera de las reivindicaciones 1 a 4.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01131036A EP1324216A1 (en) | 2001-12-28 | 2001-12-28 | Machine for classification of metadata |
PCT/EP2002/014266 WO2003056454A1 (en) | 2001-12-28 | 2002-12-14 | Method and apparatus for automatic detection of data types for data type dependent processing |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA04006378A true MXPA04006378A (es) | 2004-11-10 |
Family
ID=8179717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA04006378A MXPA04006378A (es) | 2001-12-28 | 2002-12-14 | Metodo y aparato para la deteccion automatica de tipos de datos para el procesamiento dependiente del tipo de datos. |
Country Status (9)
Country | Link |
---|---|
US (1) | US7359917B2 (es) |
EP (2) | EP1324216A1 (es) |
JP (1) | JP4438413B2 (es) |
KR (1) | KR100934537B1 (es) |
CN (1) | CN1610905B (es) |
AU (1) | AU2002356657A1 (es) |
DE (1) | DE60209572T2 (es) |
MX (1) | MXPA04006378A (es) |
WO (1) | WO2003056454A1 (es) |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6418478B1 (en) * | 1997-10-30 | 2002-07-09 | Commvault Systems, Inc. | Pipelined high speed data transfer mechanism |
US7581077B2 (en) * | 1997-10-30 | 2009-08-25 | Commvault Systems, Inc. | Method and system for transferring data in a storage operation |
US7035880B1 (en) | 1999-07-14 | 2006-04-25 | Commvault Systems, Inc. | Modular backup and retrieval system used in conjunction with a storage area network |
US7389311B1 (en) | 1999-07-15 | 2008-06-17 | Commvault Systems, Inc. | Modular backup and retrieval system |
US7395282B1 (en) * | 1999-07-15 | 2008-07-01 | Commvault Systems, Inc. | Hierarchical backup and retrieval system |
US7003641B2 (en) | 2000-01-31 | 2006-02-21 | Commvault Systems, Inc. | Logical view with granular access to exchange data managed by a modular data and storage management system |
US6658436B2 (en) | 2000-01-31 | 2003-12-02 | Commvault Systems, Inc. | Logical view and access to data managed by a modular data and storage management system |
US7155481B2 (en) | 2000-01-31 | 2006-12-26 | Commvault Systems, Inc. | Email attachment management in a computer system |
AU2003270482A1 (en) | 2002-09-09 | 2004-03-29 | Commvault Systems, Inc. | Dynamic storage device pooling in a computer system |
AU2003272456A1 (en) | 2002-09-16 | 2004-04-30 | Commvault Systems, Inc. | System and method for optimizing storage operations |
WO2004090788A2 (en) | 2003-04-03 | 2004-10-21 | Commvault Systems, Inc. | System and method for dynamically performing storage operations in a computer network |
US7454569B2 (en) | 2003-06-25 | 2008-11-18 | Commvault Systems, Inc. | Hierarchical system and method for performing storage operations in a computer network |
JP2005071227A (ja) * | 2003-08-27 | 2005-03-17 | Sony Corp | メタデータ流通管理システム,メタデータ流通管理装置,個人別メタデータ管理装置,クライアント端末,メタデータ流通管理方法およびコンピュータプログラム |
WO2005065084A2 (en) * | 2003-11-13 | 2005-07-21 | Commvault Systems, Inc. | System and method for providing encryption in pipelined storage operations in a storage network |
US7546324B2 (en) | 2003-11-13 | 2009-06-09 | Commvault Systems, Inc. | Systems and methods for performing storage operations using network attached storage |
WO2005050386A2 (en) | 2003-11-13 | 2005-06-02 | Commvault Systems, Inc. | System and method for performing a snapshot and for restoring data |
US20060224846A1 (en) | 2004-11-05 | 2006-10-05 | Amarendran Arun P | System and method to support single instance storage operations |
US7490207B2 (en) * | 2004-11-08 | 2009-02-10 | Commvault Systems, Inc. | System and method for performing auxillary storage operations |
US7707178B2 (en) | 2005-11-28 | 2010-04-27 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
US7822749B2 (en) * | 2005-11-28 | 2010-10-26 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
US7606844B2 (en) | 2005-12-19 | 2009-10-20 | Commvault Systems, Inc. | System and method for performing replication copy storage operations |
US8930496B2 (en) | 2005-12-19 | 2015-01-06 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
AU2006331932B2 (en) | 2005-12-19 | 2012-09-06 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US7617262B2 (en) | 2005-12-19 | 2009-11-10 | Commvault Systems, Inc. | Systems and methods for monitoring application data in a data replication system |
US7962709B2 (en) * | 2005-12-19 | 2011-06-14 | Commvault Systems, Inc. | Network redirector systems and methods for performing data replication |
US7651593B2 (en) | 2005-12-19 | 2010-01-26 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US7636743B2 (en) | 2005-12-19 | 2009-12-22 | Commvault Systems, Inc. | Pathname translation in a data replication system |
US8661216B2 (en) | 2005-12-19 | 2014-02-25 | Commvault Systems, Inc. | Systems and methods for migrating components in a hierarchical storage network |
US20200257596A1 (en) | 2005-12-19 | 2020-08-13 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
US8726242B2 (en) | 2006-07-27 | 2014-05-13 | Commvault Systems, Inc. | Systems and methods for continuous data replication |
US7962499B2 (en) | 2006-08-18 | 2011-06-14 | Falconstor, Inc. | System and method for identifying and mitigating redundancies in stored data |
US7882077B2 (en) | 2006-10-17 | 2011-02-01 | Commvault Systems, Inc. | Method and system for offline indexing of content and classifying stored data |
US8370442B2 (en) | 2008-08-29 | 2013-02-05 | Commvault Systems, Inc. | Method and system for leveraging identified changes to a mail server |
US20080228771A1 (en) * | 2006-12-22 | 2008-09-18 | Commvault Systems, Inc. | Method and system for searching stored data |
US8312323B2 (en) | 2006-12-22 | 2012-11-13 | Commvault Systems, Inc. | Systems and methods for remote monitoring in a computer network and reporting a failed migration operation without accessing the data being moved |
US8719809B2 (en) * | 2006-12-22 | 2014-05-06 | Commvault Systems, Inc. | Point in time rollback and un-installation of software |
US8290808B2 (en) | 2007-03-09 | 2012-10-16 | Commvault Systems, Inc. | System and method for automating customer-validated statement of work for a data storage environment |
US7836174B2 (en) * | 2008-01-30 | 2010-11-16 | Commvault Systems, Inc. | Systems and methods for grid-based data scanning |
US8296301B2 (en) | 2008-01-30 | 2012-10-23 | Commvault Systems, Inc. | Systems and methods for probabilistic data classification |
US8789168B2 (en) * | 2008-05-12 | 2014-07-22 | Microsoft Corporation | Media streams from containers processed by hosted code |
US20130144653A1 (en) * | 2008-08-05 | 2013-06-06 | Net.Orange, Inc. | System and method for visualizing patient treatment history in a network environment |
CN101685591B (zh) * | 2008-09-26 | 2011-06-22 | 鸿富锦精密工业(深圳)有限公司 | 自动检测显示装置所支持图片格式的检测装置及方法 |
US8204859B2 (en) | 2008-12-10 | 2012-06-19 | Commvault Systems, Inc. | Systems and methods for managing replicated database data |
US9495382B2 (en) | 2008-12-10 | 2016-11-15 | Commvault Systems, Inc. | Systems and methods for performing discrete data replication |
US8442983B2 (en) * | 2009-12-31 | 2013-05-14 | Commvault Systems, Inc. | Asynchronous methods of data classification using change journals and other data structures |
US9015733B2 (en) | 2012-08-31 | 2015-04-21 | Facebook, Inc. | API version testing based on query schema |
US8504517B2 (en) | 2010-03-29 | 2013-08-06 | Commvault Systems, Inc. | Systems and methods for selective data replication |
US8504515B2 (en) | 2010-03-30 | 2013-08-06 | Commvault Systems, Inc. | Stubbing systems and methods in a data replication environment |
US8725698B2 (en) | 2010-03-30 | 2014-05-13 | Commvault Systems, Inc. | Stub file prioritization in a data replication system |
US8352422B2 (en) | 2010-03-30 | 2013-01-08 | Commvault Systems, Inc. | Data restore systems and methods in a replication environment |
US8489656B2 (en) | 2010-05-28 | 2013-07-16 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US9021198B1 (en) | 2011-01-20 | 2015-04-28 | Commvault Systems, Inc. | System and method for sharing SAN storage |
US8719264B2 (en) | 2011-03-31 | 2014-05-06 | Commvault Systems, Inc. | Creating secondary copies of data based on searches for content |
CN102404411A (zh) * | 2011-12-23 | 2012-04-04 | 创新科存储技术有限公司 | 云存储系统的数据同步方法 |
US9298715B2 (en) | 2012-03-07 | 2016-03-29 | Commvault Systems, Inc. | Data storage system utilizing proxy device for storage operations |
US9471578B2 (en) | 2012-03-07 | 2016-10-18 | Commvault Systems, Inc. | Data storage system utilizing proxy device for storage operations |
US9342537B2 (en) | 2012-04-23 | 2016-05-17 | Commvault Systems, Inc. | Integrated snapshot interface for a data storage system |
US8892523B2 (en) | 2012-06-08 | 2014-11-18 | Commvault Systems, Inc. | Auto summarization of content |
US20140067781A1 (en) * | 2012-08-31 | 2014-03-06 | Scott W. Wolchok | Graph Query Language API Querying and Parsing |
US9646028B2 (en) | 2012-08-31 | 2017-05-09 | Facebook, Inc. | Graph query logic |
US10379988B2 (en) | 2012-12-21 | 2019-08-13 | Commvault Systems, Inc. | Systems and methods for performance monitoring |
US9886346B2 (en) | 2013-01-11 | 2018-02-06 | Commvault Systems, Inc. | Single snapshot for multiple agents |
US20140201140A1 (en) | 2013-01-11 | 2014-07-17 | Commvault Systems, Inc. | Data synchronization management |
WO2015073512A2 (en) * | 2013-11-13 | 2015-05-21 | The Weather Channel, Llc | Storage utility network |
US9639426B2 (en) | 2014-01-24 | 2017-05-02 | Commvault Systems, Inc. | Single snapshot for multiple applications |
US9495251B2 (en) | 2014-01-24 | 2016-11-15 | Commvault Systems, Inc. | Snapshot readiness checking and reporting |
US9632874B2 (en) | 2014-01-24 | 2017-04-25 | Commvault Systems, Inc. | Database application backup in single snapshot for multiple applications |
US9753812B2 (en) | 2014-01-24 | 2017-09-05 | Commvault Systems, Inc. | Generating mapping information for single snapshot for multiple applications |
CN104091006B (zh) * | 2014-07-01 | 2020-05-26 | 中国北方发动机研究所(天津) | Simulink中自适应的仿真和代码生成的控制方法 |
US10042716B2 (en) | 2014-09-03 | 2018-08-07 | Commvault Systems, Inc. | Consolidated processing of storage-array commands using a forwarder media agent in conjunction with a snapshot-control media agent |
US9774672B2 (en) | 2014-09-03 | 2017-09-26 | Commvault Systems, Inc. | Consolidated processing of storage-array commands by a snapshot-control media agent |
US9648105B2 (en) | 2014-11-14 | 2017-05-09 | Commvault Systems, Inc. | Unified snapshot storage management, using an enhanced storage manager and enhanced media agents |
US9448731B2 (en) | 2014-11-14 | 2016-09-20 | Commvault Systems, Inc. | Unified snapshot storage management |
US9904481B2 (en) | 2015-01-23 | 2018-02-27 | Commvault Systems, Inc. | Scalable auxiliary copy processing in a storage management system using media agent resources |
US9898213B2 (en) | 2015-01-23 | 2018-02-20 | Commvault Systems, Inc. | Scalable auxiliary copy processing using media agent resources |
US10503753B2 (en) | 2016-03-10 | 2019-12-10 | Commvault Systems, Inc. | Snapshot replication operations based on incremental block change tracking |
US10540516B2 (en) | 2016-10-13 | 2020-01-21 | Commvault Systems, Inc. | Data protection within an unsecured storage environment |
US10922189B2 (en) | 2016-11-02 | 2021-02-16 | Commvault Systems, Inc. | Historical network data-based scanning thread generation |
US10389810B2 (en) | 2016-11-02 | 2019-08-20 | Commvault Systems, Inc. | Multi-threaded scanning of distributed file systems |
US11010261B2 (en) | 2017-03-31 | 2021-05-18 | Commvault Systems, Inc. | Dynamically allocating streams during restoration of data |
US10984041B2 (en) | 2017-05-11 | 2021-04-20 | Commvault Systems, Inc. | Natural language processing integrated with database and data storage management |
US20190251204A1 (en) | 2018-02-14 | 2019-08-15 | Commvault Systems, Inc. | Targeted search of backup data using calendar event data |
US10740022B2 (en) | 2018-02-14 | 2020-08-11 | Commvault Systems, Inc. | Block-level live browsing and private writable backup copies using an ISCSI server |
US10642886B2 (en) | 2018-02-14 | 2020-05-05 | Commvault Systems, Inc. | Targeted search of backup data using facial recognition |
JP7029347B2 (ja) * | 2018-05-11 | 2022-03-03 | 株式会社東芝 | 情報処理方法、プログラムおよび情報処理装置 |
US11159469B2 (en) | 2018-09-12 | 2021-10-26 | Commvault Systems, Inc. | Using machine learning to modify presentation of mailbox objects |
US11042318B2 (en) | 2019-07-29 | 2021-06-22 | Commvault Systems, Inc. | Block-level data replication |
CN111833022B (zh) * | 2020-07-17 | 2021-11-09 | 海南大学 | 跨数据、信息、知识模态与量纲的任务处理方法及组件 |
US11494417B2 (en) | 2020-08-07 | 2022-11-08 | Commvault Systems, Inc. | Automated email classification in an information management system |
US11593223B1 (en) | 2021-09-02 | 2023-02-28 | Commvault Systems, Inc. | Using resource pool administrative entities in a data storage management system to provide shared infrastructure to tenants |
US11809285B2 (en) | 2022-02-09 | 2023-11-07 | Commvault Systems, Inc. | Protecting a management database of a data storage management system to meet a recovery point objective (RPO) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2212636A (en) * | 1987-11-17 | 1989-07-26 | Amoco Corp | Identifying data format |
US5864870A (en) | 1996-12-18 | 1999-01-26 | Unisys Corp. | Method for storing/retrieving files of various formats in an object database using a virtual multimedia file system |
US6128621A (en) * | 1997-10-31 | 2000-10-03 | Oracle Corporation | Apparatus and method for pickling data |
JP4450888B2 (ja) * | 1999-05-28 | 2010-04-14 | 富士通株式会社 | 帳票認識方法 |
US6360951B1 (en) * | 1999-12-16 | 2002-03-26 | Xerox Corporation | Hand-held scanning system for heuristically organizing scanned information |
US6662186B1 (en) * | 2000-07-14 | 2003-12-09 | Hewlett-Packard Development Company, L.P. | System and method for a data propagation file format |
-
2001
- 2001-12-28 EP EP01131036A patent/EP1324216A1/en not_active Withdrawn
-
2002
- 2002-12-14 US US10/500,204 patent/US7359917B2/en not_active Expired - Lifetime
- 2002-12-14 DE DE60209572T patent/DE60209572T2/de not_active Expired - Lifetime
- 2002-12-14 MX MXPA04006378A patent/MXPA04006378A/es active IP Right Grant
- 2002-12-14 WO PCT/EP2002/014266 patent/WO2003056454A1/en active IP Right Grant
- 2002-12-14 CN CN028264150A patent/CN1610905B/zh not_active Expired - Fee Related
- 2002-12-14 JP JP2003556904A patent/JP4438413B2/ja not_active Expired - Fee Related
- 2002-12-14 EP EP02805755A patent/EP1459218B1/en not_active Expired - Fee Related
- 2002-12-14 KR KR1020047010118A patent/KR100934537B1/ko active IP Right Grant
- 2002-12-14 AU AU2002356657A patent/AU2002356657A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
DE60209572D1 (de) | 2006-04-27 |
DE60209572T2 (de) | 2006-08-24 |
CN1610905A (zh) | 2005-04-27 |
KR20040068353A (ko) | 2004-07-30 |
JP4438413B2 (ja) | 2010-03-24 |
WO2003056454A1 (en) | 2003-07-10 |
JP2005513673A (ja) | 2005-05-12 |
EP1324216A1 (en) | 2003-07-02 |
EP1459218A1 (en) | 2004-09-22 |
US20050015402A1 (en) | 2005-01-20 |
EP1459218B1 (en) | 2006-03-01 |
AU2002356657A1 (en) | 2003-07-15 |
KR100934537B1 (ko) | 2009-12-29 |
US7359917B2 (en) | 2008-04-15 |
CN1610905B (zh) | 2010-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1459218B1 (en) | Method and apparatus for automatic detection of data types for data type dependent processing | |
US8521759B2 (en) | Text-based fuzzy search | |
US8886531B2 (en) | Apparatus and method for generating an audio fingerprint and using a two-stage query | |
KR100568437B1 (ko) | 키프레임 및 블롭 검색을 최적화하기 위한 장치 및 방법과 저장장치 | |
CN101821735B (zh) | 生成与内容项的集合相关联的元数据 | |
US8321394B2 (en) | Matching a fingerprint | |
US8359315B2 (en) | Generating a representative sub-signature of a cluster of signatures by using weighted sampling | |
US8620967B2 (en) | Managing metadata for occurrences of a recording | |
US20110289099A1 (en) | Method and apparatus for identifying video program material via dvs or sap data | |
US20110173185A1 (en) | Multi-stage lookup for rolling audio recognition | |
US20120271823A1 (en) | Automated discovery of content and metadata | |
CN101482877A (zh) | 内容显示装置 | |
US20120239689A1 (en) | Communicating time-localized metadata | |
US9720997B2 (en) | Method and apparatus for prioritizing metadata | |
US20110072117A1 (en) | Generating a Synthetic Table of Contents for a Volume by Using Statistical Analysis | |
Ishikawa et al. | Document warehousing based on a multimedia database system | |
KR20050048680A (ko) | 사용자가 사용자 인터페이스를 조작할 수 있도록 하는시스템, 방법, 컴퓨터 프로그램 제품, 및 저장 디바이스 | |
JP2004342302A (ja) | 光記憶媒体の専用位置に格納されるメニューアイテムデータに関連する付加データを格納するための方法及びメニューアイテムデータ及びこのメニューアイテムデータに関連する付加データを有するメニュー関連データを格納又は光記憶媒体から検索するための装置 | |
KR20070066509A (ko) | 이미지 파일의 관리방법 및 장치 | |
Ishikawa et al. | A document warehouse: A multimedia database approach | |
Ntalianis et al. | Visual information retrieval from annotated large audiovisual assets based on user profiling and collaborative recommendations | |
Lee et al. | Developing multimedia data warehouse of education on-demand systems | |
Gohil et al. | Multi Label Text Classification of News Articles Data Analytics Project | |
Zhou | Design Consideration of the MOR | |
KR20120137732A (ko) | 패키지 파일 생성 방법, 패키지 파일 검색 방법 및 패키지 폴더 생성 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |