MXPA97007374A

MXPA97007374A - Sistema de migracion de datos de tiempo real ymetodo que emplea archivos escasos

Info

Publication number: MXPA97007374A
Application number: MXPA/A/1997/007374A
Authority: MX
Inventors: Tung Lam Wai
Original assignee: Cheyenne Software International Sales Corp
Priority date: 1995-03-29
Filing date: 1997-09-26
Publication date: 1998-10-15

Abstract

La presente invención se refiere a un método para la migración de un archivo de datos en un sistema de computadoras en red a partir de un dispositivo de almacenamiento primario a un dispositivo de almacenamiento secundario, el archivo de datos tiene un primer tamaño real, caracterizado porque comprende las etapas de:transmitir el contenido del archivo de datos al dispositivo de almacenamiento secundario;cortar el archivo de datos;y generar un archivo escaso en el dispositivo de almacenamiento primarioque tiene un tamaño aparente igual al primer tamaño real y un segundo tamaño real menor que el primer tamaño real.

Description

SISTEMA DE MIGRACIÓN DE DATOS DE TIEMPO REAL Y MÉTODO QUE; EMPLEA ARCHIVOS ESCASOS CAMPO DE LA INVENCIÓN La presente invención se relaciona con un sistema y método de manejo de almacenamiento jerárquico y método en un sistema de computadoras en red. Más particularmente, la presente invención se relaciona con un método para hacer migrar automática y transparentemente datos de un servidor de archivos a un dispositivo de almacenamiento auxiliar.

INFORMACIÓN DE LOS ANTECEDENTES Los sistemas de manejo de datos a base del servidor han llegado a ser un estándar en el equipo de oficina y la necesidad para el manejo de datos está creciendo rápidamente. Hoy en día, muchos empleados en grandes corporaciones tienen una computadora personal (PC) o una estación de trabajo que está conectada a otras computadoras por medio de una Red de Área Local (LAN) . Una LAN generalmente incluye una pluralidad de sistemas de computadoras tales como estaciones de trabajo de computadora, que están conectadas juntas para compartir datos y recursos, tales como una memoria principal y/o una REF: 25622 impresora. La LAN frecuentemente incluye servidores que proporcionan a la red servicios. Un servidor de archivos generalmente es un nodo, por ejemplo, una computadora, en una red de computadoras que proporciona servicios a las terminales de computadora en la red por medio de manejo de recursos compartidos. Por ejemplo, un servidor de archivos puede manejar un conjunto de discos de almacenamiento y proporcionar servicios de almacenamiento de archivo para las terminales de computadora en la red que no tienen sus propios discos, o que tienen datos que necesitan ser almacenados externamente. Los requisitos de almacenamiento de las LAN están creciendo a una velocidad asombrosa. Muchos de los servidores de hoy en día manejan gigabytes de datos. Además, la capacidad para almacenar y proteger dados ha llegado a ser un asunto crítico para muchos usuarios de la red. La forma más común de proteger los datos es la de mantenerlos en más de una ubicación. Los sistemas de manejo de datos a base del servidor, como el sistema de manejo de datos ARCserveR, proporcionan respaldo y protección de los datos almacenados en un servidor de archivos de LAN y/o los sistemas de computadoras conectados a la LAN. Proporcionando únicamente respaldo y almacenamiento de datos de una red de computadoras, sin embargo, no es suficiente. En particular, el almacenamiento externo de datos necesita ser automático, óptimo y transparente para el usuario de la red. Una técnica para proporcionar almacenamiento externo eficiente de los datos de una red de computadoras es el manejo de almacenamiento jerárquico (HSM) . El HSM incluye una red de computadoras de almacenamiento de datos externa al servidor de archivos en una jerarquía de dispositivos de almacenamiento jerárquicos secundarios y posiblemente terciarios. Los dispositivos de almacenamiento externos generalmente son dispositivos de almacenamiento de alta capacidad tal como Dispositivo Óptico de Escritura de Una Sola Vez, Dispositivo Óptico de Reescritura y Cinta Magnética. Por ejemplo, un dispositivo de almacenamiento óptico y una unidad de cinta magnética pueden estar conectados al servidor de archivos como dispositivos de almacenamiento secundario y terciario, respectivamente. Basados en los criterios establecidos por la aplicación HSM, los datos almacenados en el servidor de archivos pueden hacerse migrar al dispositivo de almacenamiento óptico y, en base a los criterios seleccionables, además hacerse migrar a la unidad de cinta: Por ejemplo, la frecuencia de uso de los datos puede ser utilizada como un criterio para la migración de los datos desde el servidor de archivos a los dispositivos de almacenamiento secundario y terciario. Por la migración de los datos los cuales son utilizados poco frecuentemente o accesados, el espacio puede ser liberado en el servidor de archivos, mientras que los usuarios continúan explorando archivos como si aún residieran en el servidor de archivos. La migración se refiere al movimiento de los datos desde un servidor de archivos a un almacenamiento jerárquico (por ejemplo, dispositivos de almacenamiento externos) . Inmigración se refiere a la recuperación de datos del almacenamiento de jerarquía para el servidor de archivos. Para obtener el beneficio óptimo de un aplicación HSM, los dispositivos de almacenamiento secundario y terciario están dispuestos en una disposición jerárquica para almacenar los datos. De esta forma, un archivo de datos que ha residido en el servidor de archivos de la red durante un periodo predeterminado de tiempo, puede hacerse migrar inicialmente a un dispositivo de almacenamiento óptico, el cual proporciona una respuesta de tiempo relativamente rápida, cuando el archivo es solicitado por el servidor de archivos de la red. Si el archivo de datos permanece en el dispositivo de almacenamiento óptico durante un periodo predeterminado de tiempo sin que se solicite por el servidor de archivos, entonces el archivo de datos puede hacerse migrar además, de acuerdo con una jerarquía de almacenamiento, a un dispositivo de almacenamiento de cinta magnética, la cual tiene una respuesta de tiempo relativamente lenta comparada con el dispositivo de almacenamiento óptico. De esta forma, un sistema de manejo de almacenamiento jerárquico proporciona un método más eficiente para el almacenamiento de los archivos de datos de un sistema de computadora en red basado en el costo, velocidad y capacidad de la jerarquía de los dispositivos de almacenamiento . Cuando un archivo se hace migrar de un servidor de archivos, el archivo original es representado en el servidor de archivos como un archivo de fragmento adaptador, también mencionado como un archivo fantasma o un archivo sepulcral. El archivo de fragmento adaptador representa el archivo original, mientras que utiliza un espacio físico mínimo asignado, por lo que libera tanto espacio como sea posible en el servidor de archivos. El archivo de fragmento adaptador también debe representar, sin embargo, las propiedades del archivo original tan cercanamente como sea posible, por ejemplo, el tamaño del archivo, los datos creados, los últimos datos accesados o ciertos atributos, tales como archivo de sólo lectura. Dependiendo en la implementación HSM particular, la cual realiza la migración, sin embargo, el tamaño del archivo no está representado exactamente. Por el contrario, el archivo de fragmento adaptador que permanece en el servidor de archivos, tiene un tamaño de 0, 422 o 1000 bytes, sin considerar el tamaño real del archivo original. Por ejemplo, un archivo de 10 megabytes puede hacerse migrar desde el servidor de archivos de la red a un dispositivo de almacenamiento externo y el archivo de fragmento adaptador dejado en el servidor de archivos, generalmente aparecerá con un tamaño de 0, 422 o 1000 bytes. De esta forma, las implementaciones de migración conocidas pueden reducir la asignación de espacio físico del servidor de archivos por el uso de archivos de fragmento adaptador para representar el archivo que migró, pero los métodos de migración conocidos no representan exactamente las propiedades reales del archivo original. La exactitud de la representación, particularmente el tamaño del archivo original, es información importante para cualquier aplicación de software donde el tamaño del archivo es utilizado. Por ejemplo, algunas aplicaciones de software LAN intentan proporcionar análisis estadísticos de la cantidad de datos propiedad del servidor de archivos, o realizar algunas funciones de costumbre basadas en los tamaños del archivo particular que alcanza un valor predeterminado. Si los archivos que migraron no son representados exactamente, entonces el análisis o las funciones de costumbre o usuales no pueden realizarse adecuadamente. Además, el comando DIR del sistema operativo DOSR, por ejemplo, proporcionaría el tamaño de archivo equivocado para el usuario y lleva al usuario a confusión sobre el tamaño real del archivo. En forma similar un comando copy del sistema operativo DOSR debe mostrar un tamaño de 1000 bytes para un archivo que migró que es realmente de 2 megabytes, provocando así que el usuario intente copiar el archivo en un disco blando que es demasiado pequeño. Una implementación HSM generalmente se hace a la medida para los sistemas que operan la LAN particular. Por ejemplo, el sistema operativo NOVELLR NetWareR es utilizado en muchos sistemas de LAN. Existen varias versiones del sistema operativo NetWareR incluyendo las versiones 3.x y 4.x. Por ejemplo, en el sistema operativo NetWareR versiones 4.x, un Migrador de Datos de Tiempo Real (RTDM) , está incluida una característica. Utilizando esta característica, el contenido de un archivo en el servidor de archivos Net areR (por ejemplo, un servidor de archivos que corre el sistema operativo NetWareR) puede hacerse migrar a un dispositivo de almacenamiento secundario con una entrada de directorio de archivo que representa el archivo que se hizo migrar, que dejó en el servidor de archivos. La entrada al directorio de archivos está vacía y de esta forma no ocupará espacio físico en el servidor de archivo de NetWareR. Además la entrada al directorio de archivos indicará las propiedades correctas del archivo que migró, incluyendo el tamaño real del archivo que migró. Cuando el archivo que migró es solicitado por el servidor de archivos, el archivo será recuperado automáticamente en el servidor de archivos. De esta forma, el sistema operativo Net areR versión 4.x RTDM proporciona una herramienta para hacer migrar automática y transparentemente archivos de un volumen NetWareR a un almacenamiento secundario, mientras que se mantienen las entradas de directorio exactas en el volumen NetWareR original para los archivos que migraron. Por otro lado, el sistema operativo NetWareR versiones 3.x, por ejemplo, no proporcionan una funcionalidad de migración. Por consiguiente, los vendedores del software deben crear una función de migración de datos para servidores de archivos para sistemas operativos NetWareR versión 3.x. Las solicitudes de migración conocidas, sin embargo, no proporcionan una entrada de directorio en el servidor de archivos, lo cual es una representación exacta de los archivos que migraron; dependiendo de la aplicación, la entrada del directorio restante será un archivo de fragmento adaptador que tiene un tamaño de 0, 422 o 1000 bytes en lugar del tamaño real del archivo que migró. Un objeto de la presente invención es el de proporcionar la migración de datos, por ejemplo, desde un servidor de archivos NetWareR versión 3.x, que elimina el uso de un archivo de fragmento adaptador, que no representa exactamente el tamaño del archivo que migró. Otro objeto de la presente invención es el de proporcionar la migración e inmigración de archivos que sea absolutamente transparente para el usuario.

BREVE DESCRIPCIÓN DE LA INVENCIÓN El sistema y método de acuerdo con la presente invención utiliza una característica de sistema operativo conocido, un archivo escaso, para representar un archivo que migró. Un archivo escaso es un archivo el cual tiene un tamaño físico (por ejemplo, una asignación física) que es menor que su tamaño lógico, o aparente. El archivo escaso de esta forma reduce al mínimo el espacio físico ocupado por un archivo, mientras que retiene las propiedades reales del archivo, tales como el tamaño y la fecha en que se creó. Un archivo escaso también puede eliminar todos los bloques de datos del archivo original y ser definido porque tiene un tamaño de archivo igual al archivo original, representando de esta forma exactamente el archivo original, mientras que no ocupa esencialmente espacio físico. De acuerdo con el sistema y método de la presente invención, cuando un archivo se hace migrar de un servidor de archivos a un medio de almacenamiento, el archivo que va a migrar es reemplazado en el servidor de archivos con un archivo escaso definido porque tiene el mismo tamaño lógico y atributos que el archivo original. El archivo escaso, sin embargo, solamente consume la cantidad mínima de espacio requerida para almacenar un archivo, por ejemplo, un bloque de datos. La información clave de la migración es almacenada en el archivo escaso de tal manera que el servidor de archivos pueda recuperar el archivo que migró cuando es accesado por un usuario. Cuando un usuario accesa un archivo que migró, el archivo aparece para estar residente en el servidor de archivos con las propiedades reales del archivo, y es automática y transparentemente llevado de regreso al servidor de archivos desde el medio de almacenamiento secundario o terciario. De esta forma, el método de manejo de almacenamiento jerárquico, de acuerdo con la presente invención, elimina el uso de un archivo de fragmento adaptador que tiene un tamaño predeterminado e inexacto para representar un archivo que migró.

BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 muestra un sistema de red de área local que emplea un sistema de manejo de almacenamiento jerárquico de acuerdo con la presente invención. La Figura 2 es un diagrama de flujo ilustrativo del método para la migración de datos de tiempo real que emplea archivos escasos de acuerdo con la presente invención.

La Figura 3 es un diagrama de flujo ilustrativo del método de acuerdo con la presente invención para los datos de tiempo real que inmigran empleando los archivos escasos de acuerdo con la presente invención. La Figura 4A muestra un archivo de datos que tiene un tamaño lógico. La Figura 4B muestra una representación de archivo escaso convencional del archivo mostrado en la Figura 4A. La Figura 4C muestra una representación de archivo escaso del archivo mostrado en la Figura 4A, de acuerdo con la presente invención.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La Figura 1 ilustra un sistema LAN 1 que incluye un sistema HSM 2 de acuerdo con la presente invención. El sistema HSM 2 proporciona capacidades HSM, por ejemplo, para el ambiente del sistema operativo Net areR versión 3.x e incluye un servidor de archivos 10, también mencionado como un dispositivo de almacenamiento primario, conectado a un dispositivo de almacenamiento secundario 20. El dispositivo de almacenamiento secundario 20 además está conectado a un dispositivo de almacenamiento terciario 30. Por el uso óptimo del servidor de archivos 10, el dispositivo de almacenamiento secundario 20 y el dispositivo de almacenamiento terciario 30, el sistema HSM 2 puede almacenar jerárquica, automática y trasparentemente, por ejemplo, gigabytes de datos. El sistema LAN 1 tiene, por ejemplo, una arquitectura de servidor del cliente. El cliente es, por ejemplo, una pluralidad de estaciones de trabajo 40 conectadas al servidor de archivos 10. Una estación de trabajo 40 incluye, por ejemplo, un sistema de computadoras basado en un microprocesador. Por lo menos una de las estaciones de trabajo 40 proporciona una interfase para que un usuario establezca los criterios de migración para la migración de datos desde el servidor de archivos 10. El servidor lateral incluye el servidor de archivos 10 que tiene una máquina de migración 11 que proporciona el servicio de migración de datos trasparente del servidor de archivos 10 y el servicio de inmigración para el servidor de archivos 10. La máquina de migración 11, por ejemplo, periódicamente corre e identifica archivos inactivos de acuerdo con los criterios predefinidos. Una vez que los archivos son identificados para la migración, los archivos se hacen migrar dentro de una jerarquía de almacenamiento del sistema HSM 2, por lo que resulta en espacio de almacenamiento adicional para los archivos activos en el servidor de archivos 10. El sistema HSM 2 entonces maneja los archivos que migraron para la migración dentro de la jerarquía de almacenamiento hasta que se alcanza el nivel más bajo de la jerarquía de almacenamiento. Como se muestra en la Figura 1, el servidor lateral incluye, por ejemplo, tres módulos distintos. El primer módulo es el servidor de archivos 10 desde el cual se desean mover archivos preseleccionados, tales como archivos accesados poco frecuentemente, a dispositivos de almacenamiento menos caros. El segundo módulo es el dispositivo de almacenamiento secundario 20, tal como una Etapa Óptica la cual soporta un dispositivo de almacenamiento óptico. La Etapa Óptica puede estar sobre el servidor del sistema operativo NetWareR igual o diferente como el servidor de archivos 10. El tercer módulo es el dispositivo de almacenamiento terciario 30, tal como una Etapa de Cinta la cual soporta un cambiador de cinta. La Etapa de Cinta puede estar sobre el servidor del sistema operativo NetWareR igual o una diferente como el servidor de archivos 10 o la Etapa Óptica 20. El segundo y tercer módulos forman juntos la jerarquía de almacenamiento. Generalmente, cada etapa en la jerarquía de almacenamiento es una colección uniforme de medios de almacenamiento, por ejemplo, todos los medios en la etapa tienen la misma propiedad física. La comunicación entre la etapa se hace por medio de un protocolo de comunicaciones del sistema operativo NetWareR nativo, tal como IPX, SPX, TLI o TCP/IP. Además del dispositivo de almacenamiento secundario 20 y el almacenamiento terciario 30 mostrado en la Figura 1, las etapas de almacenamiento adicionales pueden agregarse al sistema HSM según se desee. El dispositivo de almacenamiento óptico 20, tal como un dispositivo de Reescritura Óptica, generalmente tiene un tiempo de acceso en el segundo rango de 5-10, ya que los medios de almacenamiento son removibles y usualmente necesitarán ser llevados dentro de la unidad y girar antes de que puedan ser accesados. Un dispositivo de discoteca de discos ópticos puede ser utilizado para la operación automática del almacenamiento óptico; en cualquier otra forma un operador tendría que cargar manualmente los medios de servicio solicitados. El dispositivo de almacenamiento de cinta 30, tal como una Unidad de Cinta de 8mm de Hewlett-Packard, puede tener un tiempo de acceso de varios minutos, ya que los medios de almacenamiento son removibles y usualmente será necesario que sean llevados dentro de la unidad antes de ser accesados. Puede utilizarse un autocambiador para la operación automática del almacenamiento de cinta; en cualquier otra forma un operador tendría que cargar manualmente las solicitudes de los medios de servicio. Cada etapa en la jerarquía de almacenamiento ejemplar mostrada en la Figura 1 es controlada por medio de un migrador de etapa 21, 31, respectivamente. El migrador de etapa 21, 31 incluye, por ejemplo, un programa de software residente en el servidor de archivos 10 o en un servidor de archivos separado. Los migradores de etapa 21, 31, están ubicados en el servidor de archivos que está conectado a su dispositivo de almacenamiento secundario 20 respectivo y al dispositivo de almacenamiento terciario 30. Como se muestra en la Figura 1, el migrador de etapa 21 está ubicado en el servidor de archivos 15 y el migrador de etapa 31 está ubicado en el servidor 16. Cada migrador de etapa 21, 31, por ejemplo, maneja los archivos que migraron, recupera los archivos por la solicitud y hace migrar los archivos a la siguiente etapa en la jerarquía de almacenamiento de acuerdo con las reglas de la jerarquía de almacenamiento. Debido a que cada etapa de la jerarquía de almacenamiento tiene un migrador de etapa, la jerarquía de almacenamiento puede ser distribuida, por lo que reduce la carga del procesamiento en el servidor de archivos 10, por ejemplo, por medio de los servidores de archivos 15 y 16. Un usuario del sistema LAN 1 puede establecer, por ejemplo, para el trabajo de migración para el servidor de archivos 10 completo, que será corrido periódicamente para mantener el disco de almacenamiento en el servidor de archivos 10 dentro de límites aceptables. El usuario también tiene la capacidad para hacer, por la demanda los trabajos de migración o inmigración adecuados. También los archivos de cualquier servidor de archivos 10, sin embargo, debe migrar dentro de la misma jerarquía de almacenamiento. Para un sistema para el trabajo de migración, es decir, la migración de datos del servidor de archivos 10, el usuario necesita indicar los archivos/directorios que son candidatos para la migración. El proceso de selección puede hacerse a la medida por el usuario de acuerdo con diversos criterios. Por ejemplo, variables del parámetro para que la migración de datos pueda incluir variables de datos, filtros predeterminados, o marcas de agua, las cuales se basan en la disponibilidad del almacenamiento de un dispositivo particular. La variable del parámetro de fecha se proporciona para la migración de los archivos desde el servidor de archivos 10 basado por ejemplo, en la fecha del archivo que fue el último accesado, la fecha del archivo que fue el último en actualizar o la fecha de creación del archivo. La variable del parámetro de filtro predeterminado proporcionada para la migración de los archivos del servidor de archivos 10 basado por ejemplo, en un acoplamiento de patrón para un nombre de archivo, un atributo del archivo (por ejemplo, archivo del sistema, archivo de sólo lectura) o un tamaño de archivo predeterminado. La variable del parámetro de marcas de agua se proporciona para la migración de archivos desde el servidor de archivos 10 basado en la cantidad de espacio de almacenamiento disponible en un dispositivo de almacenamiento particular. Utilizando el parámetro de marcas de agua, por ejemplo, el sistema HSM 2 podría migrar archivos desde el servidor de archivos 10 al almacenamiento secundario 20, cuando el espacio de almacenamiento disponible en el servidor de archivos 10 alcanza una marca de agua crítica, en cuyo punto la migración de emergencia ocurriría inmediatamente de acuerdo con los criterios de migración predeterminados para evitar una situación de "volumen completo" . Entonces los archivos se harían migrar hasta el espacio de almacenamiento disponible que alcanzó una marca de agua elevada (por ejemplo, un nivel seguro) . La marca de agua elevada definida, por ejemplo, como un porcentaje del espacio utilizado en el servidor de archivos 10. Cuando el espacio es utilizado por debajo de la marca de agua crítica y por arriba de la marca de agua elevada, los archivos se harán migrar en un tiempo predeterminado, por ejemplo, por lo menos en una base recientemente accesada hasta que se alcanza una marca de agua baja. Una marca de agua baja también está definida, por ejemplo, como un porcentaje del espacio utilizado en el servidor de archivos 10. Cuando el* espacio utilizado está por debajo de la marca de agua, no ocurre la migración del servidor de archivos 10.

Los parámetros para identificar los archivos que van a hacerse migrar desde el servidor de archivos 10 pueden estar combinados según se desee por el usuario. Cuando el usuario establece un sistema de trabajo de migración, el usuario también puede especificar si además la migración es realizada, por ejemplo, desde el dispositivo de almacenamiento secundario 20 al dispositivo de almacenamiento terciario 30. Además, el usuario puede especificar el periodo de tiempo que el archivo que migró debe permanecer en un dispositivo de almacenamiento antes de que se realice otra migración. Cuando un archivo que reside en el servidor de archivos 10 es identificado para la migración en la jerarquía de almacenamiento del sistema 2 HSM, el método de acuerdo con la presente invención ilustrado por el diagrama de flujo de la Figura 2 es implementado. Como se muestra en la Figura 2, el proceso es iniciado en la etapa SO cuando la máquina de migración 11 genera un comando para que migre un archivo desde el servidor de archivos 10. En la etapa SI, el archivo que va a migrar está abierto y el archivo es leído en la etapa S2. En la etapa S3, una copia de los bloques de datos del archivo que va a migrar son transmitidos al dispositivo de almacenamiento secundario 20. El migrador de etapa 21 hace regresar una clave de migración para la máquina de migración 11 que indica la ubicación del archivo que migró.

Una vez que el archivo ha sido transmitido al dispositivo de almacenamiento secundario 20, el archivo original, el cual aún está residiendo en el servidor de archivos 10, es cortado en la etapa S4. El corte del archivo original en la etapa 4 desasigna los bloques de datos del archivo original, de tal manera que los bloques de datos llegan a estar disponibles para la reasignación por el servidor de archivos 10. En este punto, el archivo original tiene una asignación física, por ejemplo, de cero bloques de datos debido a la desasignación en la etapa S4. Además, las propiedades reales del archivo original han sido almacenadas por la máquina de migración 11. En la etapa S5, la clave de migración es escrita en el archivo original, el cual ahora es un archivo escaso que tiene una asignación de tamaño físico, por ejemplo, de un bloque de datos que contiene la clave de migración. De esta forma, la asignación física del archivo escaso es más pequeña que el tamaño lógico del archivo original. En la etapa S6, la máquina de migración 11 define el archivo original teniendo un tamaño lógico igual al tamaño del archivo real del archivo original, por lo que crea un archivo escaso que tiene una asignación de tamaño físico de un bloque, pero un tamaño lógico igual al tamaño del archivo original. El proceso de migración se completa en la etapa S7, cuando la máquina de migración 11 hace salir el proceso de migración.

La operación convencional de archivos escasos está ilustrada en las Figuras 4A y 4B. Un archivo que tiene un tamaño lógico de n bloques de datos (bloques 0-n) , solamente algunos de los cuales incluyen datos, se muestra en la Figura 4A. Por ejemplo, los bloques de datos 0, 4, 7, 10 y n se muestran en la Figura 4A incluyendo datos. El archivo mostrado en la Figura 4B es un archivo escaso que representa el archivo en la Figura 4A. El archivo en la Figura 4B tiene un tamaño físico, por ejemplo, de cinco bloques de datos que representan solamente los bloques de datos ocupados de la Figura 4A. De esta forma, el archivo escaso proporciona un método para crear un archivo que tiene un tamaño físico que es mucho menor que su tamaño lógico, por lo que evita espacio de almacenamiento desperdiciado en el servidor de archivos 10. Para crear el archivo escaso mostrado en la Figura 4B, el programador de la computadora proporciona comandos específicos cuando crea el archivo, los cuales son reconocidos por el sistema LAN 1 del sistema operativo. Por ejemplo, el sistema operativo NovellR NetwareR versión 3.x interpreta el comando SEEK para no asignar los bloques de datos entre las direcciones SEEK. Por el contrario, otros sistemas de operación tratan el comando SEEK como asignación de los bloques de datos entre las direcciones SEEK. Las etapas mostradas en lo siguiente en la Tabla I son ejemplares de las etapas que pueden ser utilizadas para crear el archivo escaso ilustrado en la Figura 4B.

TABLA I Archivo Abierto Buscar para el bloque de datos 0 Escribir los datos del bloque de datos 0 Buscar los datos del bloque 4 Escribir los datos del bloque de datos 4 Buscar el bloque de datos 7 Escribir los datos del bloque de datos 7 Buscar el bloque de datos 10 Escribir los datos del bloque de datos 10 Buscar el bloque de datos n Escribir los datos del bloque de datos n Cerrar el archivo Por consiguiente, las etapas mostradas en la Tabla i"' son interpretadas por el sistema operativo NovellR NetwareR versión 3.x para asignar solamente los bloques de datos, los cuales son escritos, creando en esta forma un archivo escaso que tiene solamente 5 bloques de datos que representan los bloques de datos ocupados en 0, 4, 7, 10 y n. El archivo escaso indica su tamaño realmente, pero cuando se accesa por el usuario, el archivo se proporciona al usuario en la forma mostrada en la Figura 4A, es decir, teniendo una asignación de tamaño físico igual a su tamaño lógico. De acuerdo con la presente invención, la característica de archivo escaso, por ejemplo, el sistema operativo NovellR NetwareR versión 3.x de la característica de archivo escaso, es utilizado para representar un archivo que se ha hecho migrar desde el servidor de archivos 10 sin incluir ninguno de los bloques de datos ocupados del archivo original. De esta forma, como se muestra en la Figura 4C, un archivo escaso que tiene solamente un bloque de datos, pero definido teniendo un tamaño lógico igual al tamaño real del archivo mostrado en la Figura 4A es generado por el método de acuerdo con la presente invención. Las líneas punteadas mostradas en la Figura 4C indican el tamaño lógico del archivo, pero para el cual los bloques de datos no han sido asignados. La Tabla II muestra las etapas ejemplares para la creación del archivo escaso de la Figura 4C.

TABLA II a) Abrir el archivo b) Escribir la clave de migración c) Búsqueda para el tamaño del archivo real original d) Escribir "O" e) Cerrar el archivo.

De acuerdo con la presente invención, la característica de archivo escaso del sistema operativo NovellR NetwareR se utiliza para reducir al mínimo la asignación física necesaria para representar un archivo que migró en el servidor de archivos 10, mientras que retiene las propiedades reales del archivo original. Por consiguiente, una vez que el archivo original ha sido copiado y enviado al dispositivo de almacenamiento secundario 20 y luego cortado, el archivo restante en el servidor de archivos puede ser operado por las etapas ejemplares descritas en la Tabla II. La etapa b, la cual realiza una operación de SEEK para el tamaño del archivo real, define el archivo escaso teniendo un tamaño lógico igual al tamaño físico del archivo original. La desasignación del archivo original, sin embargo, reduce el tamaño físico ocupado por el archivo escaso en el servidor de archivos 10. Además de las etapas mostradas en la Tabla II, otro conjunto de etapas ejemplares para la creación de un archivo escaso 'de acuerdo con la presente invención se muestra en la Tabla III.

TABLA III a) Abrir el archivo b) Escribir la clave de migración c) Cambiar el tamaño al tamaño del archivo real d) Cerrar el archivo.

La operación CHANGE SIZE puede ser utilizada para definir el tamaño lógico del archivo escaso, debido a que después de la designación del archivo original en el servidor de archivos 10, no hay bloques de datos asignados los cuales serían afectados por la operación CHANGE SIZE. Por lo tanto, el método de acuerdo con la presente invención, utiliza una característica del sistema operativo conocido, un archivo escaso, para representar un archivo que migró en el servidor de archivos 10, el archivo escaso que tiene un tamaño físico mínimo, aunque está definido que tiene las propiedades reales del archivo que migró. Una vez que un archivo se ha hecho migrar desde el servidor de archivos 10 al sistema HSM 2, el archivo es recuperado por medio de la inmigración al servidor de archivos 10. La inmigración ocurre por ejemplo, cuando el usuario accesa un archivo que migró y el servidor de archivos 10 solicita el archivo por medio de la máquina de migración ll. Como se muestra en la Figura 3, el proceso de inmigración se inicia en la etapa S10 cuando un archivo que migró es solicitado por el servidor de archivos 10. En la etapa S10A, la máquina de migración 11 lee la información de la clave de migración almacenada en el archivo escaso para determinar la ubicación del archivo que migró. En la etapa S10B, la máquina de migración 11 envía la clave de migración al migrador de etapa 21. El migrador de etapa 21 utiliza la clave de migración para determinar, en la etapa S10C, si el archivo solicitado está ubicado en el dispositivo de almacenamiento secundario 20 o además se ha hecho migrar al dispositivo de almacenamiento terciario 30. Una vez que el archivo es ubicado en la etapa S10D, el archivo es enviado al servidor de archivos 10 por medio de la máquina de migración 11. En la etapa Sil, la máquina de migración 11 lee los datos del archivo solicitado. Después de que los datos del archivo que migró son leídos, el archivo escaso es abierto en la etapa S12 por la máquina de migración 11. En la etapa S13, los contenidos del archivo original recuperados del sistema HSM 2, son cargados en el archivo escaso, convirtiendo el archivo escaso de nuevo al archivo original, que tiene su asignación física original. De esta forma, después de la etapa S13, el archivo original nuevamente es residente en el servidor de archivos 10 en su forma 'original (por ejemplo, pre-migración) . Además, el usuario no estuvo consciente de que la entrada del directorio en el servidor de archivos 10 fue realmente un archivo escaso que no contiene datos reales del archivo original, sino por el contrario solamente la información descriptiva limitada. Además, la inmigración del archivo que migró es automática y transparente para el usuario.

En la etapa S14, la información de la clave de migración almacenada primeramente en el archivo escaso, la cual ya no existe ahora en el servidor de archivos 10, pero existe en la jerarquía de almacenamiento, debido a que solamente una copia del archivo original es recuperada de la jerarquía de almacenamiento, por ejemplo es almacenada en Atributo Extendido del sistema operativo NovellR NetwareR (EA) . Si el archivo recuperado no es modificado y es identificado posteriormente para la migración, la primera clave de migración será utilizada para evitar la transferencia de datos innecesaria dentro de la jerarquía de almacenamiento, ya que el archivo ya está almacenado en un dispositivo de almacenamiento externo. En este caso, solamente un archivo escaso será creado en el servidor de archivos 10. En la etapa S15, la máquina de migración 11 hace salir el proceso de inmigración. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención. Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes:

Claims

REIVINDICACIONES

1. Un método para la migración de un archivo de datos en un sistema de computadoras en red a partir de un dispositivo de almacenamiento primario a un dispositivo de almacenamiento secundario, el archivo de datos tiene un primer tamaño real, caracterizado porque comprende las etapas de: transmitir el contenido del archivo de datos al dispositivo de almacenamiento secundario; cortar el archivo de datos; y generar un archivo escaso en el dispositivo de almacenamiento primario que tiene un tamaño aparente igual al primer tamaño real y un segundo tamaño real menor que el primer tamaño real.

2. El método, de conformidad con la reivindicación 1, caracterizado además porque comprende la etapa de hacer migrar "'los datos desde el dispositivo de almacenamiento secundario a un dispositivo de almacenamiento terciario, como una función de un esquema de jerarquía de almacenamiento predeterminado .

3. El método, de conformidad con la reivindicación 1, caracterizado porque el sistema de computadoras en red incluye un sistema operativo NovellR NetwareR versión 3.x.

4. El método, de conformidad con la reivindicación 1, caracterizado porque comprende la etapa de: almacenar una clave de migración en el archivo escaso.

5. El método, de conformidad con la reivindicación 1, caracterizado porque la etapa de generar el archivo escaso además incluye las etapas de: realizar una operación de abertura en el archivo de datos; realizar una primera operación de escritura en el archivo de datos; realizar una operación de búsqueda en el archivo de datos; realizar una segunda operación de escritura en el archivo de datos; y realizar una operación de cerrar en el archivo de datos .

6. El método, de conformidad con la reivindicación 5, caracterizado porque la operación de búsqueda, busca para el primer tamaño real.

7. El método, de conformidad con la reivindicación 5, caracterizado porque la primera operación de escritura escribe una clave de migración en el archivo de datos.

8. El método, de conformidad con la reivindicación 1, caracterizado porque la etapa de generar el archivo escaso además incluye las etapas de: realizar una operación de abrir en el archivo de datos; realizar una primera operación de escritura en el archivo de datos; realizar una operación de cambio de tamaño en el archivo de datos; y realizar una operación de cerrar en el archivo de datos.

9. El método, de conformidad con la reivindicación 8, caracterizado porque la operación de cambio de tamaño, cambia el tamaño al primer tamaño real.

10. Un sistema para la migración de un archivo de datos en un sistema de computadoras en red a partir de un dispositivo de almacenamiento primario, el archivo de datos tiene un primer tamaño real, caracterizado porque comprende: una máquina de migración conectada al dispositivo de almacenamiento; y un segundo dispositivo de almacenamiento conectado a la máquina de migración; en el que la máquina de migración lee el archivo de datos, transmite los contenidos del archivo de datos al dispositivo de almacenamiento secundario y genera un archivo escaso en el dispositivo de almacenamiento primario, que tiene un tamaño aparente igual al primer tamaño real y que tiene un segundo tamaño real menor que el primer tamaño real.

11. El sistema, de conformidad con al reivindicación 10, caracterizado además porque comprende un dispositivo de almacenamiento terciario conectado al dispositivo de almacenamiento secundario, para recibir otra migración del archivo de datos como una función del esquema jerárquico de almacenamiento predeterminado.

12. El sistema, de conformidad con al reivindicación 10, caracterizado porque la máquina de migración almacena una clave de migración en el archivo escaso .

13. El sistema, de conformidad con ia reivindicación 10, caracterizado porque el sistema de computadora en red incluye un sistema operativo NovellR NetwareR versión 3.x.