FR2883392A1 - Systeme de reseau de disques et convertisseur d'interfaces - Google Patents

Systeme de reseau de disques et convertisseur d'interfaces Download PDF

Info

Publication number
FR2883392A1
FR2883392A1 FR0603276A FR0603276A FR2883392A1 FR 2883392 A1 FR2883392 A1 FR 2883392A1 FR 0603276 A FR0603276 A FR 0603276A FR 0603276 A FR0603276 A FR 0603276A FR 2883392 A1 FR2883392 A1 FR 2883392A1
Authority
FR
France
Prior art keywords
disk
response
ata
disks
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0603276A
Other languages
English (en)
Other versions
FR2883392B1 (fr
Inventor
Ikuya Yagisawa
Yutaka Nakagawa
Azuma Kano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to FR0603276A priority Critical patent/FR2883392B1/fr
Publication of FR2883392A1 publication Critical patent/FR2883392A1/fr
Application granted granted Critical
Publication of FR2883392B1 publication Critical patent/FR2883392B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3485Performance evaluation by tracing or monitoring for I/O devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0661Format or protocol conversion arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Abstract

La présente invention concerne un réseau de disques à haute fiabilité et faible coût émulant un lecteur ATA pour pouvoir l'utiliser de la même manière qu'un lecteur FC. Un système de réseau de disques comporte un dispositif de mémorisation (400) ayant une unité logique (420) ; ce dispositif comporte plusieurs dispositifs de disque ayant une première interface et un convertisseur d'interface (430) pour effectuer une conversion entre des signaux de la première interface adaptée au dispositif de disque et des signaux d'une seconde interface adaptée au dispositif de commande. Ce convertisseur comporte une partie de surveillance de temps de réponse pour surveiller une durée jusqu'à ce qu'une réponse soit reçue par le dispositif de disque et une partie d'émission de notification pour envoyer au dispositif de commande une notification d'état opérationnel du dispositif de disque conformément au temps de réponse surveillé.

Description

La présente invention concerne un système de réseau de disques et, plus
particulièrement, un système de réseau de disques adapté à une interface simple telle qu'une interface ATA (Adaptateur de Terminal Analogique).
Récemment, à la place des lecteurs FC (Fibre Canal) et des lecteurs SCSI (Interface Système pour Petits Ordinateurs) habituellement utilisés, des lecteurs ATA à faible coût conçus pour des ordinateurs personnels ont été fréquemment utilisés dans des réseaux de disques à des fins de sauvegarde/d'archivage. Le lecteur ATA exécute une réaffectation automatique pour affecter automatiquement des données d'un secteur défectueux à un autre secteur. Une nouvelle tentative est effectuée plusieurs fois pour réussir à accéder aux disques (se reporter par exemple au document "Hard Disk Drive Specification Deskstar 7K250", Hitachi Ltd., 13 août 2003, <URL: http://www.hgst.com/tech/techlib. nsf/techndocs/E8C3F8F6F3819BDB86256CD90 05AB0B9/$file/d7k250P_sp.pdf5).
D'autre part, dans des réseaux de disques habituels utilisant les lecteurs FC et les lecteurs SCSI, afm d'accroître leur fiabilité, tout symptôme de défaillance des lecteurs est surveillé et, lorsque plusieurs secteurs défectueux apparaissent, une copie préventive est effectuée. Le contrôleur de disque surveille le nombre d'occurrences des secteurs défectueux afin de détecter un déclenchement de cette copie préventive.
Du fait que le lecteur ATA décrit ci-dessus, lorsqu'il est utilisé dans le système de réseau de disques, exécute la réaffectation automatique pour affecter automatiquement des données d'un secteur défectueux à un autre secteur, le contrôleur de réseau de disques ne peut pas identifier le nombre d'occurrences des secteurs défectueux. Par conséquent, la copie préventive ne peut pas être effectuée avant que de nombreux secteurs défectueux n'apparaissent.
De plus, du fait qu'une nouvelle tentative est effectuée plusieurs fois dans le lecteur ATA décrit ci-dessus, une réponse à une demande E/S (demande d'entrée/de sortie de données) est retardée, et ainsi un délai d'attente pour un hôte peut survenir. Lorsqu'une nouvelle tentative interne est interrompue pendant cette période afin d'éviter le délai d'attente, des secteurs alternatifs pour les secteurs défectueux ne sont pas préparés et, de ce fait, la réaffectation automatique n'est pas exécutée.
Un but de la présente invention consiste à accroître la fiabilité des réseaux de disques à faible coût en émulant le lecteur ATA de sorte que le lecteur ATA peut être utilisé de la même manière que le lecteur FC.
La présente invention comporte: un dispositif de mémorisation ayant une unité logique établie de manière logique dans celui-ci; et un dispositif de commande connecté à un hôte qui nécessite une entrée/sortie de données et entre les données dans le dispositif de mémorisation et délivre en sortie les données à partir de celui-ci conformément à la demande provenant de l'hôte. Le dispositif de mémorisation comporte: une pluralité de dispositifs de disque ayant une première interface; et un convertisseur d'interface pour effectuer une conversion entre des signaux de la première interface adaptée au dispositif de disque et des signaux d'une seconde interface adaptée au dispositif de commande. Le convertisseur d'interface comporte: une partie de surveillance de temps de réponse pour surveiller une durée jusqu'à ce qu'une réponse à la demande d'entrée/de sortie de données soit reçue par le dispositif de disque; et une partie d'émission de notification pour envoyer au dispositif de commande une notification concernant l'état opérationnel des dispositifs de disque conformément au temps de réponse surveillé.
Conformément à la présente invention, le lecteur ATA peut être utilisé de la même manière que le lecteur FC, fournissant ainsi un réseau de disques à faible coût et à fiabilité élevée.
La présente invention va être mieux comprise à la lecture de la description qui va suivre faite en référence aux dessins annexés, sur lesquels: - la figure 1 est un schéma fonctionnel représentant une structure globale d'un système de réseau de disques d'un premier mode de réalisation, - la figure 2 est un schéma fonctionnel représentant une structure d'un 25 convertisseur d'interface du premier mode de réalisation, - la figure 3 est un ordinogramme d'un processus de surveillance de temps de réponse du premier mode de réalisation, - la figure 4 est un chronogramme du processus de surveillance de temps de réponse du premier mode de réalisation, - la figure 5 est un ordinogramme d'un processus de reprise sur incident du premier mode de réalisation, la figure 6 est une vue explicative d'un processus de correction du premier mode de réalisation, - la figure 7 est une vue explicative d'un processus de copie préventive du premier mode de réalisation, - la figure 8 est un schéma fonctionnel représentant une structure globale d'un système de réseau de disques d'un deuxième mode de réalisation, - la figure 9 est un schéma fonctionnel représentant un circuit de dérivation de port du deuxième mode de réalisation, et - la figure 10 est un schéma fonctionnel représentant une structure globale du 10 système de réseau de disques d'un troisième mode de réalisation.
Des modes de réalisation de la présente invention vont être décrits cidessus en se reportant aux dessins.
La figure 1 est un schéma fonctionnel représentant une structure globale d'un système de réseau de disques d'un premier mode de réalisation de la présente invention.
Comme représenté sur la figure 1, le premier mode de réalisation comporte un hôte 100, un contrôleur de réseau de disques 200, un dispositif de mémorisation 400 et un terminal de gestion 700.
Le contrôleur de réseau de disques 200 délivre des informations mémorisées dans le dispositif de mémorisation 400 à l'hôte 100 connecté à celui-ci via une interface FC d'hôte 204. Le contrôleur de réseau de disques 200 comporte une ou plusieurs unités centrales de traitement (CPU) 201, une mémoire 202, un cache 203, une ou plusieurs interfaces d'hôte 204, une ou plusieurs interfaces FC de lecteur 205 et une interface de gestion 207.
La mémoire 202 mémorise un programme de commande RAID (Réseau Redondant de Disques Indépendants Bon Marché) 210, un programme d'émission d'instructions de lecteur 220, un programme de gestion de lecteur 230, une table de gestion de lecteur 240, un programme de copie préventive 250, un programme de paramétrage de convertisseur d'interface 260, un programme de réception de notification de convertisseur d'interface 270 et un programme de communication de terminal de gestion 290. La CPU 201 appelle et exécute ces programmes afin d'exécuter divers processus. La mémoire 202 mémorise également une table de seuil de réaffectation 280.
Le cache 203 mémorise temporairement des données échangées entre l'interface FC d'hôte 204 et l'interface FC de lecteur 205.
L'interface FC d'hôte 204 transmet des signaux (instructions, données) à l'hôte 100 et reçoit ceux-ci en provenance de celui-ci conformément au protocole Fibre Canal.
L'interface FC d'hôte 204 est connectée à l'ordinateur hôte 100.
L'interface FC de lecteur 205 transmet des signaux (instructions, données) au dispositif de mémorisation 400 et reçoit ceux-ci en provenance de celui-ci conformément au protocole Fibre Canal. Cette interface FC de lecteur 205 est connectée au dispositif de mémorisation 400 via une boucle Fibre Canal (boucle FC) 600.
L'interface de gestion 207 transmet/reçoit des données et des instructions conformément, par exemple, au protocole TCP/IP. Cette interface de gestion 207 est connectée au terminal de gestion 700. Le terminal de gestion 700 comporte une partie d'entrée 710 et une partie de sortie 720, et entre des informations de gestion du dispositif de mémorisation 400 dans le terminal de gestion 700 et délivre en sortie des informations de gestion à partir de celui-ci.
Le programme de commande RAID 210 commande les opérations d'un réseau RAID constitué d'une pluralité de disques ATA 401 à 403. En d'autres termes, des données sont mémorisées d'une manière répartie dans une pluralité de disques, et lues pour être reconstituées. Si un disque connaît une défaillance, les données manquantes sont récupérées par l'intermédiaire d'une fonction de correction d'erreur (correction) (voir figure 6).
Le programme d'émission d'instructions de lecteur 220 émet des instructions pour les disques ATA 401 à 403. Le programme de gestion de lecteur 230 gère des états des disques ATA 401 à 403 en utilisant la table de gestion de lecteur 240, et effectue un rétablissement suite à diverses défaillances.
Le programme de copie préventive 250 copie le contenu de la mémoire des disques ATA 401 à 403, dans lesquels de nombreux secteurs défectueux apparaissent, sur un disque de sauvegarde (voir figure 7). Le programme de paramétrage de conversion d'interface 260 établit une condition opérationnelle du convertisseur d'interface 430 conformément à une condition qui est établie par le terminal de gestion 700.
Le programme de réception de notification de convertisseur d'interface 270 reçoit des notifications émises par le convertisseur d'interface 430 conformément aux états opérationnels des disques ATA 401 à 403 (voir figure 5). La table de gestion de seuil de réaffectation 280 mémorise et gère le nombre d'occurrences des réaffectations et des seuils utilisés pour déterminer si de nombreux secteurs défectueux apparaissent.
Le programme de communication de terminal de gestion 290 commande le 5 fonctionnement de l'interface de gestion 207.
Le dispositif de mémorisation 400 comporte un groupe de disques ATA 410 ayant une pluralité de disques ATA et un convertisseur d'interface 430, et est contenu dans une armoire de lecteur ATA.
Le groupe de disques ATA 410 comporte une pluralité de disques ATA 401 à 403, dans lesquels une unité logique (LU) 420 est établie. L'unité logique 420 est une zone de mémorisation qui est établie de manière logique dans les sources de mémorisation (disques ATA) contenues dans le dispositif de mémorisation 400. Le réseau RAID (Réseau Redondant de Disques Indépendants Bon Marché) est formé d'une pluralité de disques ATA 401 à 403 de sorte que des données mémorisées dans le groupe de disques 410 ne sont pas effacées même lorsqu'une partie des disques connaît une défaillance.
Le convertisseur d'interface 430 effectue une conversion entre le protocole Fibre Canal pour le contrôleur de réseau de disques 200 et le protocole ATA pour les disques ATA 401 à 403, et a une structure représentée sur la figure 2. Le convertisseur d'interface 430 peut également être structuré pour effectuer une conversion non seulement entre le protocole Fibre Canal et le protocole ATA utilisés dans ce mode de réalisation mais également entre d'autres protocoles afin de compléter différentes fonctions entre les protocoles.
Le convertisseur d'interface 430 comporte un processeur 431, une mémoire 432, une interface FC 434, une interface ATA 436 et une minuterie 437. Divers programmes sont mémorisés dans la mémoire 432. Le processeur 431 appelle et exécute ces programmes afin d'exécuter divers processus.
L'interface FC d'hôte 434 transmet des signaux (instructions, données) au contrôleur de réseau de disques 200 et reçoit ceux-ci en provenance de celui-ci conformément au protocole Fibre Canal. L'interface ATA 436 transmet des signaux (instructions, données) aux disques ATA 401 à 403 et reçoit ces signaux en provenance de ceux-ci conformément au protocole de canal ATA.
La mémoire 432 mémorise: un programme de réception d'instructions FC 441 pour recevoir des instructions transmises par le contrôleur de réseau de disques 200 conformément au protocole Fibre Canal; un programme de conversion d'instructions 443 pour convertir des instructions définies par un protocole particulier en des instructions définies par un protocole différent (dans ce mode de réalisation, des instructions définies par le protocole Fibre Canal en des instructions définies par le protocole ATA) ; un programme d'émission d'instructions ATA 445 pour émettre des instructions définies par le protocole ATA à destination des disques ATA 401 à 403; un programme de transfert de données FC 442 pour transmettre/recevoir des données conformément au protocole Fibre Canal; un programme de transfert de données ATA 446 pour transmettre/recevoir des données conformément au protocole de canal ATA; et un tampon de données 444 pour mémoriser temporairement les données reçues.
En outre, la mémoire 432 mémorise un programme de surveillance de temps de réponse de lecteur 451, une table de paramétrage de temps de réaffectation 452, une table de paramétrage de temps de nouvelle tentative 453, une table de paramétrage de durée de délai d'attente 454 et un programme d'émission de notification CTL 455.
Le programme de surveillance de temps de réponse de lecteur 451, conformément à un signal d'horloge délivré par la minuterie 407, surveille une durée écoulée depuis que le programme d'émission d'instructions ATA 445 a émis une instruction. Lorsque le programme de surveillance de temps de réponse de lecteur 451 détermine qu'une durée prédéterminée s'est écoulée depuis que le contrôleur de réseau de disques 200 a émis l'instruction, le programme d'émission de notification CTL 455 envoie une notification au contrôleur de réseau de disques 200. La table de paramétrage de temps de réaffectation 452, la table de paramétrage de temps de nouvelle tentative 453 et la table de paramétrage de durée de délai d'attente 454 sont utilisées pour déterminer la durée écoulée. Les durées définies dans chaque table 452 à 454 peuvent être établies de manière égale ou de manière différente dans chacun des disques ATA 401 à 403.
La figure 3 est un ordinogramme d'un processus de surveillance de temps de réponse exécuté par le programme de surveillance de temps de réponse de lecteur 451. La figure 4 est un chronogramme du processus de surveillance de temps de réponse.
Lorsqu'une instruction est envoyée par le contrôleur de réseau de disques 200 aux disques ATA 401 à 403, l'instruction est reçue dans l'interface FC 434, et le programme de réception d'instructions FC 441 analyse l'instruction. Ensuite, le programme de conversion d'instructions 443 convertit le protocole d'instructions du protocole Fibre Canal en protocole ATA, et le programme d'émission d'instructions ATA 445 émet une instruction ATA (étape 1001). L'interface ATA 436 transmet l'instruction ATA émise aux disques ATA 401 à 403.
Le programme de surveillance de temps de réponse de lecteur 451 commence à surveiller le temps de réponse depuis que l'instruction ATA a été émise (étape 1002). Ensuite, on détermine si une réponse a été reçue par les disques ATA 401 à 403 (étape 1003). Lorsque aucune réponse n'a été reçue par les disques ATA 401 à 403, on détermine si un temps de réaffectation qui est établi dans la table de paramétrage de temps de "réaffectation" 452 est écoulé (étape 1004). Lorsque le temps de réaffectation n'est pas écoulé, le processus revient à l'étape 1003, et la réponse provenant des disques ATA 401 à 403 est en outre surveillée.
D'autre part, lorsque la réponse est reçue par les disques ATA 401 à 403 avant que le temps de réaffectation ne soit écoulé, on détermine si la réponse est une réponse complète normale (étape 1005). Lorsque la réponse est la réponse complète normale, il est déterminé qu'une nouvelle tentative n'est pas exécutée dans les disques ATA, et une réponse "Satisfaisante" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1006). Lorsque la réponse n'est pas la réponse complète normale, il est déterminé qu'une défaillance est survenue dans les disques ATA, et une réponse "Non-Satisfaisante" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1007).
D'autre part, lorsque aucune réponse n'est reçue en provenance des disques ATA 401 à 403 jusqu'à ce que le temps de réaffectation soit écoulé, il est déterminé que les disques ATA ont commencé une réaffectation automatique. Ensuite, le processus passe à l'étape suivante (étape 1008).
A l'étape 1008, il est en outre déterminé si une réponse a été reçue en provenance des disques ATA 401 à 403. Lorsque aucune réponse n'a été reçue en provenance des disques ATA 401 à 403, il est déterminé si un temps de nouvelle tentative qui est établi dans la table de paramétrage de temps de nouvelle tentative 453 est écoulé (étape 1009). Lorsque le temps de nouvelle tentative n'est pas écoulé, le processus revient à l'étape 1008, et une réponse en provenance des disques ATA 401 à 403 est surveillée.
D'autre part, lorsqu'une réponse est reçue par les disques ATA 401 à 403 avant que le temps de nouvelle tentative soit écoulé, il est déterminé si la réponse est une réponse complète normale (étape 1010). Lorsque la réponse est la réponse complète normale, il est déterminé que des données ont été normalement lues à partir des disques ATA par l'intermédiaire de l'opération de nouvelle tentative, et ensuite une réponse "récupérée" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1011). Lorsque la réponse n'est pas la réponse complète normale, il est déterminé qu'une défaillance est survenue dans les disques ATA, et ensuite une réponse "Non-Satisfaisante" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1012).
D'autre part, lorsque aucune réponse n'est reçue par les disques ATA 401 à 403 jusqu'à ce que le temps de nouvelle tentative soit écoulé, il est déterminé qu'une nouvelle tentative est en cours d'exécution dans les disques ATA 401 à 403, et une réponse "nouvelle tentative" est transmise au contrôleur de réseau de disques 200 (étape 1013). Ensuite, le processus passe à l'étape suivante 1014.
A l'étape 1014, il est déterminé si une réponse a été reçue en provenance des disques ATA 401 à 403. Lorsque aucune réponse n'a été reçue en provenance des disques ATA 402 à 403, il est déterminé si une durée de délai d'attente qui est établie dans la table de paramétrage de durée de délai d'attente 454 est écoulée (étape 1015). Lorsque la durée de délai d'attente n'est pas écoulée, le processus revient à l'étape 1014, et la réponse en provenance des disques ATA 401 à 403 est surveillée.
D'autre part, lorsqu'une réponse est reçue en provenance des disques ATA 401 à 403 avant que le temps de nouvelle tentative soit écoulé, il est déterminé si la réponse est une réponse complète normale (étape 1016). Lorsque la réponse est la réponse complète normale, on détermine que la réaffectation automatique a été normalement exécutée dans les disques ATA, et une réponse "de fin de nouvelle tentative" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1017). Lorsque la réponse n'est pas la réponse complète normale, il est déterminé qu'une défaillance est survenue dans les disques ATA, et une réponse "NonSatisfaisante" est émise pour terminer ce processus de surveillance de temps de réponse (étape 1018).
D'autre part, si aucune réponse n'est reçue en provenance des disques ATA 401 à 403 une fois la durée de délai d'attente écoulée, il est déterminé qu'une défaillance est survenue dans les disques ATA. Ensuite, une réponse "délai d'attente" est transmise au contrôleur de réseau de disques 200 (étape 1019) pour terminer ce processus de surveillance de temps de réponse (étape 1020).
La figure 4 est un chronogramme représentant des notifications émises conformément au temps écoulé depuis qu'une instruction a été émise.
Lorsqu'une réponse de fin de processus est reçue en provenance des disques ATA 401 à 403 avant que le temps de réaffectation soit écoulé depuis qu'une instruction ATA a été émise par le programme d'émission d'instructions ATA 445, il est déterminé que la nouvelle tentative n'est pas en cours d'exécution dans les disques ATA, et une réponse "Satisfaisante" est transmise au contrôleur de réseau de disques 200.
Ensuite, lorsque la réponse de fin de processus est reçue en provenance des disques ATA 401 à 403 pendant que le temps de nouvelle tentative s'est écoulé, il est déterminé que la nouvelle tentative a été exécuté dans les disques ATA, et une réponse "récupérée" est transmise au contrôleur de réseau de disques 200.
Ensuite, lorsque le temps de nouvelle tentative s'est écoulé sans réponse en provenance des disques ATA 401 à 403, les disques ATA 401 à 403 sont déterminés comme étant en cours de nouvelle tentative, et une réponse "nouvelle tentative" est transmise au contrôleur de réseau de disques 200. Dans le contrôleur de réseau de disques 200, un processus de correction est exécuté par le programme de commande RAID 210 conformément à la réponse "nouvelle tentative" (voir figure 6).
Ensuite, lorsqu'une réponse de fin de processus est reçue en provenance des disques ATA 401 à 403 pendant qu'une durée de délai d'attente s'est écoulée, il est déterminé que la réaffectation automatique a été exécutée dans les disques ATA, et une réponse "fin de nouvelle tentative" est transmise au contrôleur de réseau de disques 200.
Ensuite, lorsque la durée de délai d'attente s'est écoulée sans une réponse de fin de processus en provenance des disques ATA 401 à 403, il est déterminé qu'une défaillance est survenue dans les disques ATA 401 à 403, et une durée de "délai d'attente" est transmise au contrôleur de réseau de disques 200.
La figure 5 est un ordinogramme d'un processus de reprise sur incident exécuté dans le programme de gestion de lecteur 230.
Premièrement, on surveille si une réponse a été reçue en provenance du convertisseur d'interface 430 (étape 2001).
Lorsque l'interface FC de lecteur 205 reçoit une réponse en provenance du convertisseur d'interface 430, il est déterminé si la réponse est une réponse "satisfaisante" (étape 2002). Lorsque la réponse est la réponse "satisfaisante", aucune défaillance ne survient dans les disques ATA 401 à 403 et, ainsi, ce processus de reprise sur incident se termine.
D'autre part, lorsque la réponse n'est pas la réponse "satisfaisante", il est en outre déterminé si la réponse est une réponse "récupérée" (étape 2003). Lorsque la réponse est la réponse "récupérée", la réaffectation automatique est en cours d'exécution dans les disques ATA 401 à 403 et, par conséquent, une valeur (le nombre d'occurrences de défaillances) de la table de gestion de seuil de réaffectation 280 est comptée (étape 2004) .
D'autre part, si la réponse n'est pas la réponse "récupérée", il est en outre déterminé si la réponse est la réponse "nouvelle tentative" (étape 2005). Lorsque la réponse est la réponse "nouvelle tentative", on ordonne au programme de commande RAID 210 de lire des données à partir d'autres disques de sorte que des données à lire à partir des disques ATA sont reconstituées (voir figure 6) afin de renvoyer une réponse rapide à l'hôte 100 (étape 2006).
D'autre part, lorsque la réponse n'est pas la réponse "nouvelle tentative", il est en outre déterminé si la réponse est la réponse "fin de nouvelle tentative" (étape 2007). Lorsque la réponse est la réponse "fin de nouvelle tentative", la réaffectation automatique est exécutée dans les disques ATA 401 à 403 et, ainsi, une valeur (le nombre d'occurrences de défaillances) est comptée (étape 2008).
D'autre part, lorsque la réponse est la réponse "fin de nouvelle tentative", il est en outre déterminé si la réponse est la réponse "délai d'attente" (étape 2009). Lorsque la réponse est la réponse "délai d'attente", une défaillance est survenue dans les lecteurs ATA 401 à 403 et, ainsi, on ordonne au programme de commande RAID 210 d'exécuter le processus de reprise sur incident (étape 2010). A cet instant, étant donné qu'il est envisagé qu'une défaillance résultant du délai d'attente (par exemple, un arrêt imprévu) survienne dans les disques ATA 401 à 403 du fait de l'instruction émise, le lecteur ATA qui ne renvoie aucune réponse est initialisé par l'intermédiaire d'une stricte remise à zéro.
D'autre part, lorsque la réponse n'est pas la réponse "délai d'attente", il ne s'agit pas d'une réponse supposée, de sorte qu'aucune opération n'est exécutée et ce processus de reprise sur incident se termine.
La figure 6 est une vue explicative d'un processus de correction exécuté par le programme de commande RAID 210.
Le processus de correction est le suivant. Comme décrit ci-dessus, lorsqu'une défaillance survient dans un secteur A d'un disque situé le plus à gauche, et qu'une réponse en provenance du disque est retardée, des données sont lues à partir des secteurs B, C et D dans d'autres disques formant le réseau RAID, lesquels secteurs correspondent au secteur A. L'opération OU-Exclusif des données lues est calculée pour générer des données A', qui sont les mêmes que celles mémorisées dans le secteur A, et une réponse est transmise à l'hôte. Les données calculées sont écrites dans le secteur A défectueux (ou dans un secteur réaffecté).
Comme décrit ci-dessus, même lorsque la réponse en provenance des disques est retardée en exécutant une nouvelle tentative plusieurs fois dans les disques, les données peuvent être rapidement renvoyées à l'hôte en exécutant le processus de correction à la réception de la réponse "nouvelle tentative". Par conséquent, le délai d'attente dans l'hôte peut être évité. De plus, un temps d'attente de l'hôte peut être réduit avant le délai d'attente, de manière à supprimer le retard de processus dans l'hôte.
La figure 7 est une vue explicative d'un processus de copie préventive exécuté par le programme de copie préventive 250.
La copie préventive est exécutée de manière préventive lorsqu'il est déterminé que le nombre de secteurs défectueux des disques a augmenté conformément au résultat de comparaison entre le nombre des réaffectations enregistrées dans la table de gestion de seuil de réaffectation 280 par le programme de gestion de lecteur 230 et un seuil prédéterminé (par exemple, lorsque le nombre des réaffectations est supérieur au seuil prédéterminé). En d'autres termes, lorsque de nombreux secteurs sont défectueux mais que la lecture/l'écriture n'est pas complètement impossible, le contenu de la mémoire du disque dans lequel de nombreux secteurs sont défectueux est copié sur des disques de sauvegarde.
Comme décrit ci-dessus, dans le premier mode de réalisation de la présente invention, le convertisseur d'interface 430 destiné à effectuer une conversion entre des signaux de l'interface ATA adaptée aux disques ATA 401 à 403 et des signaux de l'interface Fibre Canal adaptée au contrôleur de réseau de disques 200 est fourni. En résultat, le lecteur ATA peut être utilisé de la même manière que le lecteur FC.
Le convertisseur d'interface 430 surveille si une réponse à une instruction de demande d'entrée/sortie de données est reçue en provenance des disques ATA 401 à 403 pendant le temps de réaffectation, et détermine que la réaffectation automatique est en cours d'exécution dans les disques ATA 401 à 403 lorsque la réponse est reçue par les disques ATA 401 à 403 quand le temps de réaffectation est dépassé. Ensuite, la réponse"récupérée" est envoyée au contrôleur de réseau de disques 200. Le programme de gestion de lecteur 230 reçoit la réponse "récupérée" pour mettre à jour le nombre des réaffectations dans les disques, ce nombre étant enregistré dans la table de gestion de seuil de réaffectation 280. Lorsque le nombre enregistré dans la table de gestion de seuil de réaffectation 280 est supérieur à un seuil prédéterminé, on détermine que le nombre de secteurs défectueux dans les disques a augmenté et, ainsi, la copie préventive est effectuée. En d'autres termes, en considérant le fait qu'un temps de réponse est retardé dans la réaffectation automatique et en surveillant le temps de réponse, une occurrence de la réaffectation automatique (occurrence de secteurs défectueux) peut être détectée pour exécuter la copie préventive en utilisant le nombre d'occurrences de secteurs défectueux en tant que seuil.
Lorsque aucune réponse n'est reçue en provenance des disques ATA 401 à 403 jusqu'au temps de nouvelle tentative, la réponse "nouvelle tentative" est envoyée au contrôleur de réseau de disques 200. Lorsque le programme de gestion de disques 230 reçoit la réponse "nouvelle tentative", il lit des données à partir d'autres disques formant le réseau RAID sans attendre une réponse en provenance des disques ATA, reconstitue des données (correction de données) en utilisant les données lues, et transmet les données reconstituées à l'hôte 100. Dans le même temps, le programme de gestion de lecteur 230 amène le lecteur dans un état de nouvelle tentative, et attend la réaffectation automatique du fait du succès de la nouvelle tentative ou une réponse d'erreur du fait de l'échec de la nouvelle tentative. Par conséquent, la prévention du délai d'attente de l'hôte et le lancement de la réaffectation automatique des disques sont compatibles.
La figure 8 est un schéma fonctionnel représentant une structure globale d'un système de réseau de disques d'un deuxième mode de réalisation de la présente invention.
Le deuxième mode de réalisation est différent du premier mode de réalisation décrit ci-dessus (figure 1) en ce que le convertisseur d'interface est fourni pour chaque disque ATA dans le deuxième mode de réalisation. Les mêmes composants que ceux du premier mode de réalisation sont désignés par les mêmes références numériques que celles du premier mode de réalisation, et ne sont décrits en détail.
Un dispositif de mémorisation 300 comporte un groupe de réseaux de disques 310 constitué d'une pluralité de disques ATA, des convertisseurs d'interface 351 à 353 et un circuit de dérivation de port 330, et est contenu dans une armoire de lecteur ATA.
Le groupe de disques ATA 310 comporte une pluralité de disques ATA 301 à 303. Une unité logique (LU) 320 est établie dans les disques ATA 301 à 303. Un réseau RAID est formé d'une pluralité de disques ATA 301 à 303.
Les convertisseurs d'interface 351 à 353 effectuent une conversion entre le protocole Fibre Canal pour le contrôleur de réseau de disques 200 et le protocole ATA pour les disques ATA 301 à 303, et chacun d'eux comporte la structure représentée sur la figure 2. Dans le premier mode de réalisation, différentes durées définies dans chaque table parmi la table de paramétrage de temps de réaffectation 452, la table de paramétrage de nouvelle tentative 453 et la table de paramétrage de durée de délai d'attente 454 peuvent être établies pour chacun des disques ATA 301 à 303. Dans le deuxième mode de réalisation, du fait que les convertisseurs d'interface 351 à 353 sont respectivement connectés aux disques ATA 301 à 303, chacune des tables mémorise une valeur pour chacun des disques ATA.
Le circuit de dérivation de port 330, comme représenté sur la figure 9, comporte une pluralité de sélecteurs 331 à 334 correspondant au nombre de disques connectés et un contrôleur. Ces sélecteurs, dans un état normal, sont connectés via la ligne en traits pleins. Lorsqu'une défaillance survient dans une partie des disques ou du contrôleur, les sélecteurs sont connectés via la ligne en pointillés de manière à déconnecter les disques ou le contrôleur subissant une défaillance d'une boucle Fibre Canal 600. En conséquence, la boucle Fibre Canal 600 n'est pas déconnectée.
Comme décrit ci-dessus, dans le deuxième mode de réalisation de la présente invention, en plus de l'effet du premier mode de réalisation, en combinant les disques ATA 301 à 303 et les convertisseurs d'interface 351 à 353 et en retirant ceux-ci, le lecteur ATA et le convertisseur d'interface peuvent être convertis en lecteur FC. En résultat, la facilité de maintenance du dispositif de mémorisation peut être accrue.
La figure 10 est un schéma fonctionnel représentant une structure globale d'un système de réseau de disques d'un troisième mode de réalisation de la présente invention.
Le troisième mode de réalisation est différent du premier mode de réalisation (figure 1) en ce que le convertisseur d'interface est agencé dans le contrôleur de réseau de disques 200 du troisième mode de réalisation. Les mêmes composants que ceux du premier mode de réalisation sont désignés par les mêmes références numériques que celles du premier mode de réalisation et ne vont pas être décrits en détail.
Le contrôleur du réseau de disques 200 comporte une ou plusieurs CPU 201, une mémoire 202, un cache 203, une ou plusieurs interfaces FC d'hôte 204, une ou plusieurs interfaces ATA de lecteur 206, une interface de gestion 207 et une minuterie 208. Le contrôleur de réseau de disques 200 délivre des informations mémorisées dans le groupe de disques ATA 510 à l'hôte 100 connecté à celui-ci via l'interface FC d'hôte 204.
La mémoire 202 mémorise un programme de commande RAID 210, un programme d'émission d'instructions de lecteur 220, un programme de gestion de lecteur 230, une table de gestion de lecteur 240, un programme de copie préventive 250, un programme de paramétrage de durées 265, une table de gestion de seuil de réaffectation et un programme de communication de terminal de gestion 290.
En outre, dans le troisième mode de réalisation, la mémoire 202 mémorise un programme de surveillance de temps de réponse de lecteur 291, une table de paramétrage de temps de réaffectation 292, une table de paramétrage de temps de nouvelle tentative 293 et une table de paramétrage de durée de délai d'attente 294. Ces programmes 291 à 294 fonctionnent de la même manière que le programme de surveillance de temps de réponse de lecteur 451, la table de paramétrage de temps de réaffectation 452, la table de paramétrage de temps de nouvelle tentative 453 et la table de paramétrage de durée de délai d'attente 454.
Ces programmes sont appelés et exécutés par la CPU 201 afin d'exécuter divers 25 processus.
Le programme de paramétrage de durées 265 définit des durées mémorisées dans la table de paramétrage de temps de réaffectation 292, la table de paramétrage de temps de nouvelle tentative 293 et la table de paramétrage de durée de délai d'attente 294 qui sont référencées par le programme de surveillance de temps de réponse de lecteur 291.
Le groupe de disques ATA 510 comporte une pluralité de disques ATA 501 à 503. Une unité logique (LU) 520 est établie dans les disques 501 à 503. Les disques ATA 501 à 503 forment un réseau RAID.
Comme décrit ci-dessus, dans le troisième mode de réalisation, en plus de l'effet du premier mode de réalisation, l'effet suivant est obtenu. Du fait que la structure réalisant la même fonction que le lecteur FC est agencée dans le contrôleur de réseau de disques 200, il n'est pas nécessaire de fournir une structure pour la conversion d'interface, ce qui contribue à réduire le coût du dispositif de mémorisation.

Claims (5)

REVENDICATIONS
1. Système de réseau de disques comportant un dispositif de mémorisation (400) ayant une pluralité de dispositifs de disque (401, 402, 403) et un disque de 5 sauvegarde pour conserver une copie de données de la pluralité de dispositifs de disque et un contrôleur de réseau de disques (200) comprenant: - une unité centrale de commande (201) commandant l'entrée/sortie de données vers et respectivement depuis chacun de la pluralité de dispositifs de disque selon une commande entrée/sortie de données reçue d'un ordinateur-hôte (100), une interface d'hôte (204) pour recevoir des commandes depuis l'ordinateur-hôte (100) selon un premier protocole, une interface de lecteur (205) reliée au dispositif de mémorisation (400) et agencée pour communiquer avec la pluralité de dispositifs de disque (401, 402, 403) selon un second protocole différent dudit premier protocole, et une mémoire (432) pour mémoriser: un programme de surveillance de temps de réponse (451) pour surveiller un temps de réponse entre l'envoi d'une instruction d'entrée/sortie de données à l'un de la pluralité de dispositifs de disque (401, 402, 403) et la réception d'une réponse à cette instruction d'entrée/sortie de données par le dispositif de disque concerné, une table de gestion de seuil (280) agencée pour mémoriser un nombre de réaffectations effectuées dans chacun de la pluralité de dispositifs de disque, et un programme de conversion (443) pour convertir des instructions entre ledit premier protocole et ledit second protocole.
2. Système de réseau de disques selon la revendication 1, dans lequel lorsque le temps de réponse surveillé est plus long qu'un premier temps prédéterminé le contrôleur de réseau de disques (200) est agencé pour compter le nombre de réaffectations mémorisées dans la table de gestion de seuil (280) pour le dispositif de disque concerné et lorsque le nombre de réaffectations mémorisées pour ledit dispositif de disque concerné devient plus grand qu'un seuil prédéterminé, le contrôleur de réseau de disques (200) est 15 20 25 agencé pour copier des données mémorisées dans le dispositif de disque concerné vers le disque de sauvegarde.
3. Système de réseau de disques selon la revendication 1, dans lequel la pluralité de dispositifs de disque (401, 402, 403) sont disposés de manière redondante pour former au moins un groupe RAID, et lorsque le temps de réponse surveillé pour une commande de requête de données du dispositif de disque concerné est supérieur à un second temps prédéterminé le contrôleur de réseau de disques (200) est agencé pour corriger les données requises en obtenant des données de dispositifs de disque autres que ledit dispositif de disque concerné qui font partie d'un groupe RAID incluant le dispositif de disque concerné, et transmettre les données ainsi créées à l'ordinateur-hôte (100).
4. Système de réseau de disques selon la revendication 2, dans lequel le premier temps prédéterminé est plus court que le second temps prédéterminé.
5. Système de réseau de disques selon l'une quelconque des revendications précédentes, dans lequel chaque dispositif de disque de la pluralité de dispositifs de disque (401, 402, 403) est un dispositif de disque ATA et ledit second protocole est un protocole ATA, ladite interface d'hôte est une interface FC et le programme de conversion des instructions est configuré pour réaliser la conversion entre un protocole FC et un protocole ATA.
FR0603276A 2006-04-13 2006-04-13 Systeme de reseau de disques et convertisseur d'interfaces Expired - Fee Related FR2883392B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0603276A FR2883392B1 (fr) 2006-04-13 2006-04-13 Systeme de reseau de disques et convertisseur d'interfaces

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0603276A FR2883392B1 (fr) 2006-04-13 2006-04-13 Systeme de reseau de disques et convertisseur d'interfaces

Publications (2)

Publication Number Publication Date
FR2883392A1 true FR2883392A1 (fr) 2006-09-22
FR2883392B1 FR2883392B1 (fr) 2007-11-30

Family

ID=36808718

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0603276A Expired - Fee Related FR2883392B1 (fr) 2006-04-13 2006-04-13 Systeme de reseau de disques et convertisseur d'interfaces

Country Status (1)

Country Link
FR (1) FR2883392B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2348681A1 (fr) * 2008-10-24 2011-07-27 Chengdu Huawei Symantec Technologies Co., Ltd. Procédé et système de mémoire, carte de service de terminal, carte de commande, et carte de canal de mémoire

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758057A (en) * 1995-06-21 1998-05-26 Mitsubishi Denki Kabushiki Kaisha Multi-media storage system
US5872906A (en) * 1993-10-14 1999-02-16 Fujitsu Limited Method and apparatus for taking countermeasure for failure of disk array
US5923876A (en) * 1995-08-24 1999-07-13 Compaq Computer Corp. Disk fault prediction system
US20020062387A1 (en) * 2000-10-30 2002-05-23 Michael Yatziv Interface emulation for storage devices
US6442711B1 (en) * 1998-06-02 2002-08-27 Kabushiki Kaisha Toshiba System and method for avoiding storage failures in a storage array system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872906A (en) * 1993-10-14 1999-02-16 Fujitsu Limited Method and apparatus for taking countermeasure for failure of disk array
US5758057A (en) * 1995-06-21 1998-05-26 Mitsubishi Denki Kabushiki Kaisha Multi-media storage system
US5923876A (en) * 1995-08-24 1999-07-13 Compaq Computer Corp. Disk fault prediction system
US6442711B1 (en) * 1998-06-02 2002-08-27 Kabushiki Kaisha Toshiba System and method for avoiding storage failures in a storage array system
US20020062387A1 (en) * 2000-10-30 2002-05-23 Michael Yatziv Interface emulation for storage devices

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2348681A1 (fr) * 2008-10-24 2011-07-27 Chengdu Huawei Symantec Technologies Co., Ltd. Procédé et système de mémoire, carte de service de terminal, carte de commande, et carte de canal de mémoire
EP2348681A4 (fr) * 2008-10-24 2012-05-02 Chengdu Huawei Symantec Tech Procédé et système de mémoire, carte de service de terminal, carte de commande, et carte de canal de mémoire

Also Published As

Publication number Publication date
FR2883392B1 (fr) 2007-11-30

Similar Documents

Publication Publication Date Title
FR2863734A1 (fr) Systeme de reseau de disques et convertisseur d&#39;interface
US11199978B2 (en) Data protection with multiple site replication
US7793060B2 (en) System method and circuit for differential mirroring of data
US6662281B2 (en) Redundant backup device
US7882393B2 (en) In-band problem log data collection between a host system and a storage system
US6920580B1 (en) Negotiated graceful takeover in a node cluster
KR100577314B1 (ko) 가상의 저장영역 네트워크를 설정하기 위한 네트워크 데이터의 미러링 방법 및 가상 저장영역 네트워크
US7472241B2 (en) Storage system and backup method
FR2859294A1 (fr) Systeme de reseau de disques et procede de commande d&#39;informations d&#39;erreur
US8312454B2 (en) System administration method and apparatus
US20120131275A1 (en) Network-attached storage system
EP0755010B1 (fr) Dispositif d&#39;interface entre un calculateur à architecture redondante et un moyen de communication
FR2865817A1 (fr) Systeme de memorisation ayant une pluralite d&#39;interfaces
FR2870367A1 (fr) Systeme et procede de restauration de disque apres incident disque
US20060200471A1 (en) Method and apparatus for communicating between an agent and a remote management module in a processing system
US7797571B2 (en) System, method and circuit for mirroring data
US8099634B2 (en) Autonomic component service state management for a multiple function component
FR2807532A1 (fr) Dispositif et procede de memorisation de donnees de journalisation dans un reseau de communication
FR2883392A1 (fr) Systeme de reseau de disques et convertisseur d&#39;interfaces
WO1995019002A1 (fr) Procede de sauvegarde et/ou d&#39;archivage de donnees et/ou de fichiers informatiques et dispositif pour la mise en ×uvre dudit procede
FR2952259A1 (fr) Outil de diagnostic pour reseaux a haut debit
US20180341540A1 (en) Call home message containing bundled diagnostic data
KR100419606B1 (ko) Cli기반 네트워크 장비 관리 시스템과 네트워크 장비간정책 정보 일관성을 유지를 위한 망 관리 인터페이스운용장치 및 방법
JP2018022402A (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法および情報処理装置の制御プログラム
GB2416912A (en) Disk array system and interface converter

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20110228