EP2518627B1

EP2518627B1 - Procédé de traitement de panne partielle dans un système informatique

Info

Publication number: EP2518627B1
Application number: EP20120165177
Authority: EP
Inventors: Tomoki Sekiguchi; Hitoshi Ueno
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2011-04-25
Filing date: 2012-04-23
Publication date: 2014-08-27
Anticipated expiration: 2032-04-23
Also published as: EP2518627B8; JP2012230444A; EP2518627A2; US8868968B2; EP2518627A3; US20120272091A1; JP5548647B2

Claims

Procédé de traitement de défaillance matérielle dans un système informatique virtuel ayant une pluralité de partitions logiques (LPAR) (210, 260, 310 et 360) générées sur un premier ordinateur physique (100) et un second ordinateur physique (200) qui forment des grappes, sous la commande d'hyperviseurs, dans lequel un premier hyperviseur (250) dans le premier ordinateur physique commande une pluralité de partitions logiques LPAR générées sur le premier ordinateur physique et dispose d'informations d'avis de défaillance (252) qui indiquent si une partition logique LPAR peut être oui ou non interrompue pour chaque partition logique LPAR sur le premier ordinateur physique, le procédé de traitement de défaillance matérielle comportant les étapes consistant à :
répondre à une occurrence d'une défaillance matérielle dans le premier ordinateur physique en :
amenant le premier hyperviseur (250) à :
identifier une première partition logique LPAR (260) parmi la pluralité de partitions logiques LPAR sur le premier ordinateur physique qui devient impossible à exécuter du fait de l'influence de la défaillance matérielle, et

transmettre un avis de défaillance qui indique que la poursuite de l'exécution est impossible dans la première partition logique LPAR pour entraîner l'exécution de la première partition logique LPAR à être interrompu et une unité de commande de grappe (370) dans une deuxième partition logique LPAR (360), qui forme une grappe avec la première partition logique LPAR et qui est générée sur le second ordinateur physique, pour exécuter un basculement de la première partition logique LPAR sur la deuxième partition logique LPAR,

amener une unité de commande de grappe (270) dans la première partition logique LPAR à changer les informations d'avis de défaillance pour la première partition logique LPAR en réponse à la réception de l'avis de défaillance qui indique que la poursuite de l'exécution est impossible de sorte que les informations d'avis de défaillance indiquent que la première partition logique LPAR peut être interrompue,

amener le premier hyperviseur à transmettre un avis de défaillance qui indique que la poursuite de l'exécution est possible, mais qu'une défaillance matérielle est survenue, à une troisième partition logique LPAR (210), qui est différente de la première partition logique LPAR, sur le premier ordinateur physique de sorte qu'une unité de commande de grappe (320) dans une quatrième partition logique LPAR (310), qui forme une grappe avec la troisième partition logique LPAR et qui est générée sur le deuxième ordinateur physique, exécute un basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et

amener une unité de commande de grappe (220) dans la troisième partition logique LPAR à changer les informations d'avis de défaillance pour la troisième partition logique LPAR, en réponse à l'achèvement du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, de sorte que les informations d'avis de défaillance indiquent que la troisième partition logique LPAR peut être interrompue.
Procédé de traitement de défaillance matérielle selon la revendication 1, dans lequel
les informations d'avis de défaillance gèrent si (402) une demande d'avis de défaillance est présente pour la partition logique LPAR et si (404) la partition logique LPAR peut être interrompue après un basculement, en ce qui concerne une défaillance matérielle qui n'affecte pas l'exécution des partitions logiques LPAR, pour chaque partition logique LPAR sur le premier ordinateur physique,
le premier hyperviseur (250) se rapporte aux informations d'avis de défaillance, et si il existe une demande pour un avis de défaillance matérielle en provenance de la troisième partition logique LPAR qui peut poursuivre l'exécution, le premier hyperviseur transmet l'avis de défaillance à la troisième partition logique LPAR, et
une unité de commande de grappe dans la troisième partition logique LPAR qui a reçu l'avis de défaillance dispose d'informations de demande basculement (223) pour gérer une situation du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et définit la présence (1110) d'une demande pour le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR dans les informations de demande de basculement.
Procédé de traitement de défaillance matérielle selon la revendication 2, dans lequel
l'unité de commande de grappe dans la troisième partition logique LPAR se rapporte aux informations de demande de basculement (223) et si la demande basculement existe, l'unité de commande de grappe dans la troisième partition logique LPAR effectue le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et
à la fin du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, l'unité de commande de grappe dans la troisième partition logique LPAR établit une possibilité d'arrêt (404) pour la troisième partition logique LPAR dans les informations d'avis défaillance (252) dans le premier hyperviseur (250) à "possible" après le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR.
Procédé de traitement de défaillance matérielle selon la revendication 3, dans lequel
le système informatique virtuel comprend une unité d'affichage de situation de défaillance (910),
l'unité d'affichage de situation de défaillance affiche une situation d'opération (1002, 1012) et une possibilité d'arrêt (1004, 1014) pour chaque partition logique LPAR comprise dans le système, et
la possibilité d'arrêt affichée dans l'unité d'affichage de situation de défaillance est basée sur la capacité d'arrêt de la partition logique LPAR après un basculement géré par les informations d'avis de défaillance (252).
Procédé de traitement de défaillance matérielle selon la revendication 3, dans lequel l'unité de commande de grappe dans la troisième partition logique LPAR fait référence aux informations de demande de basculement (223) lors de chaque période de temps prédéterminée.
Procédé de traitement de défaillance matérielle selon la revendication 1, dans lequel
des hyperviseurs dans le premier ordinateur physique (100) et le second ordinateur physique (200) ont des interfaces pour enregistrer qu'une partition logique LPAR demande un avis de défaillance matérielle pour laquelle l'exécution de la partition logique LPAR peut se poursuivre, et
les hyperviseurs dans le premier ordinateur physique et le second ordinateur physique informent une partition logique LPAR qui a demandé un avis, d'une défaillance matérielle pour laquelle l'exécution de la partition logique LPAR peut se poursuivre, conformément à une situation d'enregistrement via les interfaces.
Procédé de traitement de défaillance matérielle selon la revendication 1, dans lequel
le premier hyperviseur (250) et un second hyperviseur compris dans le second ordinateur physique ont des interfaces pour notifier que la troisième partition logique LPAR a exécuté le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR,
au moins l'un du premier hyperviseur et du second hyperviseur conserve une situation d'avis de copie de traitement avec une défaillance de partition logique LPAR, et
au moins l'un du premier hyperviseur et du deuxième hyperviseur dispose d'une interface pour acquérir la situation d'avis.
Procédé de traitement de défaillance matérielle selon la revendication 7, comportant une procédure et un dispositif pour acquérir et afficher une situation de copie avec une défaillance conservée par au moins l'un du premier hyperviseur et du deuxième hyperviseur.
Procédé de traitement de défaillance matérielle selon la revendication 7, comportant :
une procédure pour recevoir un avis d'une défaillance matérielle permettant de poursuivre l'exécution depuis au moins l'un du premier hyperviseur (250) et du deuxième hyperviseur et exécuter un transfert de système, et

une procédure pour notifier qu'un traitement pour la copie avec une défaillance a été exécuté après l'achèvement du transfert de système, via une interface d'au moins l'un du premier hyperviseur et du deuxième hyperviseur,

dans lequel une situation d'achèvement du transfert de système peut être acquise à partir d'au moins l'un du premier hyperviseur et du deuxième hyperviseur.
Système informatique virtuel ayant une pluralité de partitions logiques (LPAR) (210, 260, 310 et 360) générées sur un premier ordinateur physique (100) et un second ordinateur physique (200) qui forment des grappes, sous la commande d'hyperviseurs, dans lequel :
un premier hyperviseur (250) dans le premier ordinateur physique est conçu pour commander une pluralité de partitions logiques LPAR générées sur le premier ordinateur physique, dans lequel le premier hyperviseur dispose d'informations d'avis de défaillance (252) qui indiquent si une partition logique LPAR peut être oui ou non interrompue pour chaque partition logique LPAR sur le premier ordinateur physique,

dans lequel lors de l'une occurrence d'une défaillance matérielle dans le premier ordinateur physique :
le premier hyperviseur (250) est configuré pour :
identifier une première partition logique LPAR (260) parmi la pluralité de partitions logiques LPAR sur le premier ordinateur physique qui devient impossible à exécuter du fait de l'influence de la défaillance matérielle, et

transmettre un avis de défaillance qui indique que la poursuite de l'exécution est impossible dans la première partition logique LPAR pour entraîner l'exécution de la première partition logique LPAR à être interrompu et une unité de commande de grappe (370) dans une deuxième partition logique LPAR (360), qui forme une grappe avec la première partition logique LPAR et qui est générée sur le second ordinateur physique, pour exécuter un basculement de la première partition logique LPAR sur la deuxième partition logique LPAR,

une unité de commande de grappe (270) dans la première partition logique LPAR est configurée pour changer les informations d'avis de défaillance pour la première partition logique LPAR en réponse à la réception de l'avis de défaillance qui indique que la poursuite de l'exécution est impossible de sorte que les informations d'avis de défaillance indiquent que la première partition logique LPAR peut être interrompue,

le premier hyperviseur est en outre configuré pour transmettre un avis de défaillance qui indique que la poursuite de l'exécution est possible, mais qu'une défaillance matérielle est survenue, à une troisième partition logique LPAR (210), qui est différente de la première partition logique LPAR, sur le premier ordinateur physique de sorte qu'une unité de commande de grappe (320) dans une quatrième partition logique LPAR (310), qui forme une grappe avec la troisième partition logique LPAR et qui est générée sur le deuxième ordinateur physique, exécute un basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et

une unité de commande de grappe (220) dans la troisième partition logique LPAR est configurée pour changer les informations d'avis de défaillance pour la troisième partition logique LPAR, en réponse à l'achèvement du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, de sorte que les informations d'avis de défaillance indiquent que la troisième partition logique LPAR peut être interrompue.
Système informatique virtuel selon la revendication 10, dans lequel
les informations d'avis de défaillance gèrent si (402) une demande d'avis de défaillance est présente pour la partition logique LPAR et si (404) la partition logique LPAR peut être interrompue après un basculement, en ce qui concerne une défaillance matérielle qui n'affecte pas l'exécution des partitions logiques LPAR, pour chaque partition logique LPAR sur le premier ordinateur physique,
le premier hyperviseur (250) se rapporte aux informations d'avis de défaillance, et si il existe une demande pour un avis de défaillance matérielle en provenance de la troisième partition logique LPAR qui peut poursuivre l'exécution, le premier hyperviseur transmet l'avis de défaillance à la troisième partition logique LPAR, et
une unité de commande de grappe dans la troisième partition logique LPAR qui a reçu l'avis de défaillance dispose d'informations de demande basculement (223) pour gérer une situation du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et définit la présence (1110) d'une demande pour le second basculement dans les informations de demande de basculement.
Système informatique virtuel selon la revendication 11, dans lequel
l'unité de commande de grappe dans la troisième partition logique LPAR se rapporte aux informations de demande de basculement (223) et si la demande basculement existe, l'unité de commande de grappe dans la troisième partition logique LPAR effectue le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, et
à la fin du basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR, l'unité de commande de grappe dans la troisième partition logique LPAR établit une possibilité d'arrêt (404) pour la troisième partition logique LPAR dans les informations d'avis défaillance (252) dans le premier hyperviseur (250) à "possible" après le basculement de la troisième partition logique LPAR sur la quatrième partition logique LPAR.
Système informatique virtuel selon la revendication 12, dans lequel
le système informatique virtuel comprend une unité d'affichage de situation de défaillance (910),
l'unité d'affichage de situation de défaillance affiche une situation d'opération (1002, 1012) et une possibilité d'arrêt (1004, 1014) pour chaque partition logique LPAR comprise dans le système, et
la possibilité d'arrêt affichée dans l'unité d'affichage de situation de défaillance est basée sur la capacité d'arrêt de la partition logique LPAR après un basculement géré par les informations d'avis de défaillance (252).
Système informatique virtuel selon la revendication 12, dans lequel l'unité de commande de grappe dans la troisième partition logique LPAR fait référence aux informations de demande de basculement lors de chaque période de temps prédéterminée.