BR112020004407A2

BR112020004407A2 - sistema de alta disponibilidade de uma máquina virtual openstack para impedir split-brain.

Info

Publication number: BR112020004407A2
Application number: BR112020004407-5A
Authority: BR
Inventors: Ao Zhang; Jiang Wu; Song Tian
Original assignee: Wuhan Fiberhome Information Integration Technologies Co., Ltd.
Priority date: 2018-12-04
Filing date: 2018-12-18
Publication date: 2021-06-22
Also published as: CN109614201A; CN109614201B; WO2020113670A1; PH12020550045A1

Abstract

SISTEMA DE ALTA DISPONIBILIDADE DE UMA MÁQUINA VIRTUAL OPENSTACK PARA IMPEDIR SPLIT-BRAIN. É descrito na invenção um sistema de alta disponibilidade de uma máquina virtual Openstack para impedir split-brain, que compreende um dispositivo terminal de gerenciamento, uma rede de gerenciamento, um dispositivo de nó de computação e um dispositivo de armazenamento compartilhado; em que pelo menos dois dispositivos terminais de gerenciamento se comunicam através da rede de gerenciamento para formar um agrupamento de gerenciamento; o dispositivo terminal de gerenciamento e o dispositivo de nó de computação ficam em conexão de comunicação através da rede de gerenciamento; o dispositivo de nó de computação é conectado no dispositivo de armazenamento compartilhado; e cada dispositivo terminal de gerenciamento compreende: um módulo de controle Nova; um módulo de gerenciamento do agrupamento; e um módulo de alta disponibilidade, que é configurado para realizar o gerenciamento de alta disponibilidade para todos os dispositivos do nó de computação; além do programa da VM de computação em nuvem, o dispositivo de nó de computação compreende adicionalmente: um módulo de computador Nova; um módulo de gerenciamento de Libvirt, configurado para prover um processo de gerenciamento de uma interface da API Hipervisora padrão na KVM; um módulo de gerenciamento de trava, correspondido com o módulo de gerenciamento de Libvirt e configurado para atualizar e monitorar a pulsação de trava dos dispositivos de armazenamento compartilhados; e um módulo do nó de computação de alta disponibilidade, pelo menos configurado para relatar a pulsação de trava para o dispositivo terminal de gerenciamento.

Description

1 / 36

SISTEMA DE ALTA DISPONIBILIDADE DE UMA MÁQUINA VIRTUAL OPENSTACK PARA IMPEDIR SPLIT-BRAIN Campo da Invenção

[001] A presente invenção refere-se ao campo da computação em nuvem, em particular, a um sistema de alta disponibilidade (HA) de uma máquina virtual (VM) Openstack para impedir split-brain, que pertence ao campo dos computadores. Fundamentos da Invenção

[002] Com a maturidade das soluções de tecnologia em nuvem, a plataforma de computação em nuvem com base em Openstack tem se tornado cada vez mais amplamente usada em vários campos, e um grande número de sistemas empresariais foi portado para a plataforma em nuvem para prover os serviços, em que a função de alta disponibilidade (HA) da máquina virtual (VM) foi introduzida no ambiente em nuvem como um importante recurso da plataforma de virtualização, e tem se tornado crescentemente importante na atual interação ambiental. A função é configurada para recuperar automaticamente a VM em execução quando um hospedeiro físico falhar, o que pode não apenas melhorar a confiabilidade da plataforma em nuvem, mas, também, melhorar enormemente a capacidade de manutenção da íntegra da plataforma.

[003] Entretanto, não há solução de HA completa no Openstack nativo: por um lado, no módulo Nova responsável pelo gerenciamento da função de computação, apenas uma interface de Evacuação é provida para evacuar as VMs para outros nós no evento da falha do hospedeiro, mas o próprio módulo carece da função de gerenciamento de agendamento de HA; por outro lado, Masakari, um projeto de fonte sub-aberta que lida com HA, acabou de se tornar um projeto oficial do projeto de incubação Openstack, e o próprio projeto ainda tem maturidade muito baixa. O mesmo

2 / 36 pode apenas completar a recuperação de HA em uns poucos cenários, então, o mesmo não pode suportar o uso comercial.

[004] Além do mais, alguns fabricantes também proveem suas próprias soluções de HA, tal como a solução provida pela American Red Hat Company, que implementa as funções de HA e Vedação (isolamento) através do software Pacemaker. A íntegra da solução precisa se basear no plano IPMI e no hardware dog, e pode apenas lidar com cenários simples, tal como o hospedeiro monitorando as anormalidades da rede, e não pode lidar com e distinguir os complexos cenários de falha de outros planos de rede (tais como o plano da rede de gerenciamento, o plano da rede empresarial e o plano da rede de armazenamento, etc.) nos nós de computação. Sumário da Invenção

[005] A presente invenção provê um sistema de alta disponibilidade de uma máquina virtual Openstack para impedir split-brain, que compreende um dispositivo terminal de gerenciamento, uma rede de gerenciamento, um dispositivo de nó de computação e um dispositivo de armazenamento compartilhado; em que pelo menos dois dispositivos terminais de gerenciamento se comunicam através da rede de gerenciamento para formar um agrupamento de gerenciamento; o dispositivo terminal de gerenciamento e o dispositivo de nó de computação ficam em conexão de comunicação através da rede de gerenciamento o dispositivo de nó de computação é conectado no dispositivo de armazenamento compartilhado; cada dispositivo terminal de gerenciamento compreende: um módulo de controle Nova, que compreende o processo de gerenciamento de VM nativo de Nova, configurado para gerenciar o ciclo de vida útil da VM;

3 / 36 um módulo de gerenciamento do agrupamento, configurado para coletar a informação do estado de execução do agrupamento; e um módulo HA, configurado para realizar o gerenciamento de HA para todos os dispositivos do nó de computação; um método que o módulo HA executa o gerenciamento de HA, que compreende as seguintes operações: Operação A-1, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar, e, se normal, ir para a Operação A-2; Operação A-2, verificar o estado relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a próxima Operação A-3; Operação A-3, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades precisam ser manipuladas uma por uma; se nenhuma manipulação for exigida, finalizar a manipulação da anormalidade do dispositivo de nó de computação e retornar para a prévia Operação A-2; caso contrário, ir para a próxima Operação A-4; Operação A-4, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, o programa da VM de computação em nuvem em execução no dispositivo de nó de computação é controlado pelo módulo de controle Nova para interromper a execução, e finalizar; caso contrário, ir para a próxima Operação A-5; Operação A-5, emitir uma solicitação de Vedação para o dispositivo de nó de computação conectado com o estado normal do dispositivo de armazenamento compartilhado, e Vedar, isto é, fechar por

4 / 36 encerramento o programa da VM de computação em nuvem deste nó; Operação A-6, emitir um comando para o módulo de controle Nova para disparar o programa da VM de computação em nuvem em execução no dispositivo de nó de computação para executar; além do programa da VM de computação em nuvem, o dispositivo de nó de computação compreende adicionalmente: um módulo de computador Nova, configurado para responder diretamente a todos os processos de gerenciamento do dispositivo terminal de gerenciamento para controlar o estado de execução da VM e para comunicar com a API Hipervisora; um módulo de gerenciamento de Libvirt, configurado para prover o processo de gerenciamento de uma interface da API Hipervisora padrão na KVM; um módulo de gerenciamento de trava, correspondido com o módulo de gerenciamento de Libvirt, configurado para atualizar e monitorar a pulsação de trava dos dispositivos de armazenamento compartilhados; e um módulo do nó de computação HA, pelo menos configurado para relatar a pulsação de trava para o dispositivo terminal de gerenciamento; em que um método para executar o módulo do nó de computação HA compreende as seguintes operações: Operação C-1, quando a VM atualizar e armazenar continuamente a pulsação de trava, nenhuma manipulação é exigida se a gravação da pulsação de trava estiver normal; caso contrário, uma vez que a gravação da pulsação de trava estiver anormal, ir para a Operação C-2; Operação C-2, o módulo de gerenciamento de trava relata os eventos de armazenamento anormais para o dispositivo terminal de gerenciamento e espera pelo resultado da manipulação realimentado pelo dispositivo terminal de gerenciamento; Operação C-3, se o dispositivo terminal de gerenciamento

5 / 36 retornar o resultado da manipulação no tempo especificado, ir para a Operação C-5; caso contrário, ir para a Operação C-4; Operação C-4, se o dispositivo terminal de gerenciamento falhar em retornar o resultado da manipulação no tempo especificado, o módulo de gerenciamento de trava realiza uma operação de Vedação, isto é, fecha por encerramento ou veda o programa da VM de computação em nuvem do dispositivo de nó de computação; Operação C-5, o módulo de gerenciamento de trava determina se a Vedação é exigida de acordo com o resultado da manipulação retornado pelo dispositivo terminal de gerenciamento.

[006] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: depois que o dispositivo terminal de gerenciamento emitir a solicitação de Vedação para o dispositivo de nó de computação conectado com o estado normal do dispositivo de armazenamento compartilhado, o módulo HA executa adicionalmente as seguintes operações: Operação B-1, monitorar continuamente os eventos de Vedação relatados pelo dispositivo de nó de computação; e, uma vez que houver mensagem recebida, ir para a Operação B-2; Operação B-2, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação B-3; Operação B-3, verificar o estado da rede relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a Operação B-4; Operação B-4, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades precisam ser manipuladas; se nenhuma

6 / 36 manipulação for exigida, ir para a Operação B-6; caso contrário, ir para a Operação B-5; Operação B-5, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, Vedação não é exigida, ir para a Operação B-6, e finalizar; caso contrário, ir para a Operação B-7; Operação B-6, para um cenário no qual Vedação não é exigida, emitir uma solicitação de interrupção de Vedação para o correspondente dispositivo de nó de computação; Operação B-7, para um cenário no qual Vedação é exigida, emitir uma solicitação de execução de Vedação para o correspondente dispositivo de nó de computação; o processo de recuperação depois do reinício do módulo de gerenciamento de trava compreende as seguintes operações: Operação D-1, quando o módulo de gerenciamento de Libvirt for iniciado, registrar e obter a pulsação de trava através do módulo de gerenciamento de trava; se o registro falhar, ir para a Operação D-2; Operação D-2, uma vez que o registro da pulsação de trava falhar, fechar por encerramento o programa da VM de computação em nuvem do dispositivo de nó de computação; Operação D-3, o módulo de gerenciamento de Libvirt grava todos os dispositivos do nó de computação do programa da VM de computação em nuvem que são fechados por encerramento, e grava os mesmos em arquivos de registro de Vedação; Operação D-4, verificar periodicamente os arquivos de registro de Vedação, e ir para a Operação D-5 se houver uma atualização verificada; Operação D-5, relatar os arquivos de registro de Vedação de

7 / 36 todos os dispositivos do nó de computação para o dispositivo terminal de gerenciamento; se o relato falhar, finalizar esta manipulação e deixar para o próximo relato; caso contrário, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento emite as instruções para a recuperação.

[007] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento realiza as seguintes operações específicas: Operação D-6, o dispositivo terminal de gerenciamento recebe os arquivos de registro de Vedação relatados pelo dispositivo de nó de computação, e determina se a manipulação automática é exigida; se a manipulação automática for exigida, ir para a Operação D-8; e, se a manipulação automática não for exigida, ir para a Operação D-7; Operação D-7, o dispositivo terminal de gerenciamento envia um alarme que deve ser manipulado manualmente; Operação D-8, o dispositivo terminal de gerenciamento manipula automaticamente o programa da VM de computação em nuvem vedado e invoca a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

[008] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: o dispositivo de armazenamento compartilhado é gerenciado e executado por um programa de gerenciamento de arquivo CephFS ou NFS; o processo de gerenciamento de VM compreende Nova-api, Nova-conductor ou Nova-scheduler; o módulo de gerenciamento do agrupamento compreende Etcd ou Consul.

8 / 36

[009] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: a rede de gerenciamento compreende: um plano da rede de gerenciamento, configurado para acoplar com o dispositivo terminal de gerenciamento e para prover o serviço de gerenciamento; um plano da rede de armazenamento, configurado para acoplar com o dispositivo de armazenamento compartilhado secundário e para prover o serviço de armazenamento; um plano da rede empresarial, configurado para acoplar com o dispositivo de nó de computação e para prover o serviço de acesso para a VM de computação em nuvem.

[0010] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: quando o plano da rede de gerenciamento, o plano da rede de armazenamento e o plano da rede empresarial da rede de gerenciamento estiverem todos normais, o estado da rede relatado pelo dispositivo de nó de computação na Operação A-2 através da rede de gerenciamento será julgado como normal; caso contrário, de acordo com o tipo de interrupção específico do dispositivo de nó de computação que está anormal, julgar que um ou mais do plano da rede de gerenciamento, do plano da rede de armazenamento e do plano da rede empresarial devem ser manipulados desta maneira.

[0011] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: a rede de gerenciamento compreende: um plano da rede de gerenciamento, configurado para acoplar com o dispositivo terminal de gerenciamento e para prover o serviço de gerenciamento; um plano da rede de armazenamento, configurado para acoplar

9 / 36 com o dispositivo de armazenamento compartilhado secundário e para prover o serviço de armazenamento; um plano da rede empresarial, configurado para acoplar com o dispositivo de nó de computação e para prover o serviço de acesso para a VM de computação em nuvem; correspondentemente, quando o plano da rede de gerenciamento, o plano da rede de armazenamento e o plano da rede empresarial da rede de gerenciamento estiverem todos normais, o estado da rede relatado pelo dispositivo de nó de computação na Operação B-3 através da rede de gerenciamento será julgado como normal; caso contrário, de acordo com o tipo de interrupção específico do dispositivo de nó de computação que está anormal, julgar que um ou mais do plano da rede de gerenciamento, do plano da rede de armazenamento e do plano da rede empresarial devem ser sujeitos ao correspondente manipulação de Vedação.

[0012] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: o programa da VM de computação em nuvem tem um sistema operacional GuestOS da VM, que realiza as seguintes operações de recuperação depois da Vedação: Operação E-1, o Qga no sistema GuestOS da VM e o módulo do nó de computação HA do dispositivo de nó de computação mantêm a pulsação de trava continuamente; quando o programa da VM de computação em nuvem falhar, ir para a Operação E-2; Operação E-2, quando o módulo do nó de computação HA receber o relato de eventos anormais, o mesmo relata para o dispositivo terminal de gerenciamento; Operação E-3, depois de receber o relato de eventos anormais, o dispositivo terminal de gerenciamento invoca diretamente a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a

10 / 36 execução novamente.

[0013] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: a falha compreende a ocorrência de tela azul ou paralização ou interrupção fatal do dispositivo de nó de computação, em que o programa da VM de computação em nuvem está em execução.

[0014] O sistema HA da VM Openstack para impedir split-brain na presente invenção pode ter adicionalmente os seguintes recursos: depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento realiza as seguintes operações específicas: Operação D-6, o dispositivo terminal de gerenciamento recebe os arquivos de registro de Vedação relatados pelo dispositivo de nó de computação, e determina se a manipulação automática é exigida; se a manipulação automática for exigida, ir para a Operação D-8 e, se a manipulação automática não for exigido, ir para a Operação D-7; Operação D-7, o dispositivo terminal de gerenciamento envia um alarme que deve ser manipulado manualmente; Operação D-8, o dispositivo terminal de gerenciamento manipula automaticamente o programa da VM de computação em nuvem vedado e invoca a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente. Função e Efeito da Invenção

[0015] De acordo com o sistema HA da VM Openstack para impedir split-brain provido pela presente invenção, em virtude do módulo HA, pode- se executar o método de gerenciamento de HA. Através de uma série de operações de A-1 até A-6, as detecções de alta disponibilidade do estado do dispositivo de nó de computação conectado e do dispositivo de armazenamento compartilhado podem ser realizadas em tempo real. De

11 / 36 acordo com o tipo de estado anormal, pode ser aprendido: a anormalidade do dispositivo de nó de computação ou aquela do dispositivo de armazenamento compartilhado e, em particular, em qual parte a rede de gerenciamento está anormal: o plano da rede de gerenciamento, o plano da rede de armazenamento, ou o plano da rede empresarial; e, então, se realiza-se a operação de Vedação para fechar o programa da VM de computação em nuvem correspondente ao dispositivo de nó de computação anormal depois do julgamento pode ser decidido, desse modo, garantindo a HA do programa da VM de computação em nuvem do dispositivo de nó de computação no sistema.

[0016] Em virtude de o módulo do nó de computação HA, que pode executar uma série de operações de C-1 a C-5, a atualização e o armazenando da pulsação de trava da trava de leitura-gravação de trava distribuída em tempo real, o relato da falha de gravação durante a atualização no dispositivo terminal de gerenciamento em tempo real, e operação de acordo com o resultado da manipulação do dispositivo terminal de gerenciamento: se adota- se Vedação para fechar o programa da VM de computação em nuvem do dispositivo de nó de computação, para refinar a intensidade da proteção de trava da trava de leitura-gravação distribuída do nível do hospedeiro do dispositivo de nó de computação para o nível da VM, que pode prover proteção de leitura-gravação concorrente para uma única VM. Breve Descrição dos Desenhos

[0017] A figura 1 mostra um diagrama estrutural esquemático do sistema HA da VM Openstack para impedir split-brain na modalidade da presente invenção; a figura 2 mostra um fluxograma do método de gerenciamento de HA para o dispositivo terminal de gerenciamento de HA da VM Openstack para impedir split-brain na modalidade da presente invenção; a figura 3 mostra um fluxograma de Vedação pelo módulo HA

12 / 36 no dispositivo terminal de gerenciamento de HA da VM Openstack para impedir split-brain na modalidade da presente invenção; a figura 4 mostra um fluxograma do método de gerenciamento de HA for o dispositivo de nó de computação de HA da VM Openstack para impedir split-brain na modalidade da presente invenção; a figura 5 mostra um diagrama esquemático da recuperação de processo depois do reinício do processo do módulo de gerenciamento de trava do dispositivo de nó de computação de HA da VM Openstack para impedir split-brain na modalidade da presente invenção; e a figura 6 mostra um diagrama esquemático das etapas do programa da VM de computação em nuvem no dispositivo de nó de computação de HA da VM Openstack para impedir split-brain na modalidade da presente invenção para realizar a operação de recuperação depois da Vedação. Descrição Detalhada das Modalidades

[0018] A fim de tornar os meios técnicos, os recursos criativos, os objetivos e os efeitos da presente invenção fáceis de ser entendidos, as seguintes modalidades fazem uma descrição detalhada do sistema HA da VM Openstack para impedir split-brain de um sistema de gerenciamento de tutoriais em combinação com os desenhos. Explicação das abreviações e dos termos técnicos

[0019] VM: Máquina Virtual, refere-se a um completo sistema de computador em execução em um ambiente completamente vedado com completas funções do sistema de hardware simuladas pelo software.

[0020] Openstack: Openstack é um projeto da plataforma de gerenciamento de computação em nuvem em fonte aberta desenvolvido e patrocinado pela NASA (Administração Nacional da Aeronáutica e Espaço) e Rackspace, e é um software gratuito e um projeto de código de fonte aberta autorizado sob a licença Apache.

13 / 36

[0021] Nova: é um componente de gerenciamento do recurso de computação no projeto Openstack, que compreende Nova-api, Nova- scheduler, Nova-conductor, Nova-compute e ainda outros processos. Como um controlador de computação central como a íntegra do projeto Openstack, Nova é configurado para implementar o gerenciamento de ciclo de vida útil de instâncias da máquina virtual do usuário para prover os serviços virtuais, as operações para o ciclo de vida útil da VM, tais como criação, início, desativação, suspensão, pausa, ajuste, migração, reinício, destruição da VM, etc., bem como as funções da configuração de especificação da CPU e da memória, e agendamento de agrupamento.

[0022] Nova-api: é uma interface interativa externa provida por Nova, e é uma entrada de manipulação de mensagem. Os gerenciadores podem gerenciar suas infraestruturas internas através desta interface, ou os mesmos podem prover os serviços para os usuários através desta interface. Quando a solicitação for recebida, através de validação básica, a mesma irá enviar cada solicitação para o próximo módulo através de uma fila de mensagens.

[0023] Nova-scheduler: é principalmente configurado para completar o agendamento de cada instância da VM no Nova. O mesmo pode despachar o agendamento de instâncias para os nós apropriados com base em condições, tais como arquitetura da CPU, memória do hospedeiro, carga, disponibilidade de certas exigências de hardware, etc.

[0024] Nova-conductor: é um manipulador de tarefas longas no interior de Nova. O mesmo é principalmente configurado para manipular o gerenciamento de rastreamento de tarefas demoradas, tais como criação e migração de instâncias da VM. Além do mais, o mesmo também é responsável pelo controle de acesso da base de dados para evitar que Nova- compute acesse diretamente a base de dados.

[0025] Nova-computer: fica localizado no nó de computação e um executor real da operação de gerenciamento do ciclo de vida útil da VM. O

14 / 36 mesmo recebe as solicitações através das filas de mensagens, responde aos processos de gerenciamento nos nós de controle, e é diretamente responsável por várias comunicações com o Hipervisor.

[0026] Controlador de Nova: é uma definição de papel ou um título. No geral, refere-se a processos Nova, compreendendo Nova-api, Nova- conductor, Nova-scheduler, etc., que são principalmente responsáveis pela manipulação das operações de gerenciamento da VM. No geral, é implementado em um nó separado chamado de um nó de gerenciamento, não com o nó de computação em que o Nova-compute reside.

[0027] HaStack: adota uma estrutura C-S para prover um dos dois componentes autopesquisados com a função de HA, e fica localizado no lado do Servidor. Como um cérebro do gerenciamento de HA, o mesmo é configurado para gerenciar o comportamento global de HA, e suas funções são realizadas pelo módulo de alta disponibilidade.

[0028] HaStack-Agent: adota uma estrutura C-S para prover um dos dois componentes autopesquisados com a função de HA, e fica localizado no lado do Agente. É principalmente responsável pela montagem do diretório compartilhado, relato do estado da pulsação do nó e eventos de Vedação da VM; além do mais, o mesmo é correspondido com a HaStack para gerenciar algumas ações de HA, e suas funções são completadas pelo módulo do nó de computação de alta disponibilidade.

[0029] API: Interface de Programação da Aplicação; os componentes são distinguidos pela exposição do kernel através da API para acesso externo.

[0030] Hipervisor: é uma camada intermediária de software que executa entre o servidor físico e o sistema operacional, permitindo que múltiplos sistemas operacionais e aplicações compartilhem um conjunto de hardware físico básico, de forma que o mesmo possa ser considerado como um “meta” sistema operacional em um ambiente virtual. Como uma abstração do hardware da plataforma e do sistema operacional, o mesmo pode

15 / 36 coordenar o acesso a todos os dispositivos físicos e máquinas virtuais no servidor, também conhecido como o monitor da máquina virtual. O hipervisor é o núcleo de todas as tecnologias de virtualização. A capacidade de suportar a migração de múltiplas cargas de trabalho sem interrupção é uma função básica do Hipervisor. Quando o servidor inicia e executa o Hipervisor, o mesmo irá alocar a quantidade apropriada de memória, CPU, rede e disco magnético em cada máquina virtual, e carregar os sistemas operacionais convidados em todas as máquinas virtuais.

[0031] KVM: Máquina Virtual com base em Kernel; é um módulo de virtualização do sistema de fonte aberta e é uma virtualização completa com base em hardware. A mesma é principalmente configurada para prover uma máquina virtual com base em kernel.

[0032] Libvirt: é configurado para prover o processo de gerenciamento de uma interface da API Hipervisora padrão na KVM.

[0033] Trava, que é executada pelo módulo de gerenciamento de trava 304, é definido no dispositivo de nó de computação 300, coopera (corresponde) com o componente Libvirt, e fica localizado na camada superior do dispositivo de armazenamento compartilhado 500, para completar a atualização e o monitoramento das várias pulsações de trava. A Trava é configurada para prover as travas de leitura-gravação distribuídas para controlar e gerenciar as gravações concorrentes no mesmo armazenamento. O módulo de trava inovador na modalidade é um gerenciador de trava de leitura- gravação distribuída inovadoramente inventado em relação à função de Trava nativa. O módulo de Trava nativo também pode ser usado conforme necessário, ou fazer o redesenvolvimento adaptativo para a Trava nativa.

[0034] Etcd: uma base de dados de valor chave distribuído de alta disponibilidade, a mesma é implementada por linguagem GO, a forte consistência é assegurada através do algoritmo de consistência. Nesta solução, como o software de agrupamento, a mesma é principalmente configurada para

16 / 36 prover as seguintes duas funções: I, para configurar um agrupamento de três planos para perceber o estado de saúde global para tomada de decisão de HA; II, como a ponte de informação entre a HaStack e a HaStack-Agent.

[0035] Consul: é uma ferramenta de fonte aberta lançada por HashiCorp e configurada para implementar descoberta e configuração de serviço do sistema distribuído. Como o software de agrupamento nesta solução, desempenha um papel na detecção em três planos e uma ponte de informação entre HaStack e HaStack-Agent.

[0036] Ceph: é uma peça de software de armazenamento distribuído unificado desenhada para excelentes desempenho, confiabilidade e escalonabilidade.

[0037] CephFS: é um sistema de arquivos distribuído com base no armazenamento Ceph. Nesta solução, o mesmo é principalmente configurado para armazenar os arquivos de trava de vários módulos de Trava.

[0038] NFS: sistema de arquivos em rede; permite que os computadores na rede compartilhem arquivos ou diretórios uns com os outros através da rede TCP/IP. O servidor de NFS pode permitir que o cliente NFS monte o diretório compartilhado no servidor de NFS remoto ao cliente NFS local. Nas aplicações NFS, as aplicações clientes NFS locais podem ler e gravar transparentemente os arquivos em servidores de NFS remotos, assim como os mesmos podem acessar as partições de disco e os diretórios locais.

[0039] Vedação: refere-se a que, no campo distribuído, quando o estado de alguns recursos for incerto, os recursos suspeitos são vedados e fechados com o propósito de proteção de dados para evitar split-brain.

[0040] GuestOS: no campo da virtualização, o Convidado é configurado para se referir a um sistema virtual, um exemplo de uma máquina virtual que executa o software (tal como um sistema operacional). O GuestOS é exatamente o sistema operacional para a VM.

[0041] QGA: Qemu-Guest-Agent; é um procedimento de aplicação

17 / 36 comum em execução na VM, isto é, uma porta serial é adicionada na VM para comunicação de soquete com o hospedeiro, para implementar um modo de interação entre o hospedeiro e a VM. Modalidade 1

[0042] Da forma mostrada na figura 1, o sistema HA da VM Openstack para impedir split-brain compreende um dispositivo terminal de gerenciamento 100, uma rede de gerenciamento 200, um dispositivo de nó de computação 300 e um dispositivo de armazenamento compartilhado 400.

[0043] Pelo menos dois dispositivos terminais de gerenciamento se comunicam através da rede de gerenciamento para formar um agrupamento de gerenciamento 110.

[0044] O dispositivo terminal de gerenciamento e o dispositivo de nó de computação ficam em conexão de comunicação através da rede de gerenciamento.

[0045] O dispositivo de nó de computação é conectado no dispositivo de armazenamento compartilhado.

[0046] Especificamente, da forma mostrada na figura 1, três dispositivos terminais de gerenciamento 100 (isto é, os nós de controle A, B, C na figura), três dispositivos do nó de computação 300 (isto é, os nós de computação A, B, C na figura) e um dispositivo de armazenamento compartilhado 400 são ilustrados como exemplos.

[0047] Na modalidade, todos os três dispositivos do nó de computação 300 são conectados em um dispositivo de armazenamento compartilhado 400, isto é, os três dispositivos do nó de computação 300 compartilham um dispositivo de armazenamento compartilhado 400.

[0048] Cada dispositivo terminal de gerenciamento 100 compreende um módulo de controle Nova 101, um módulo de gerenciamento do agrupamento 102, e um módulo HA 103.

[0049] O módulo de controle Nova 101 é o controlador de Nova na

18 / 36 figura. O módulo de controle Nova 101 compreende o processo de gerenciamento de VM nativo de Nova e é configurado para gerenciar o ciclo de vida útil da VM.

[0050] O módulo de gerenciamento do agrupamento 102 é o Etcd na figura. O módulo de gerenciamento do agrupamento 102 é configurado para coletar a informação do estado de execução do agrupamento.

[0051] O módulo HA 103 é o FitOS HaStack na figura. O módulo HA 103 é configurado para realizar o gerenciamento de HA para todos os dispositivos do nó de computação.

[0052] A rede de gerenciamento 200 é dividida em três planos de rede principais, a saber, um plano da rede de gerenciamento 201, um plano da rede de armazenamento 202, e um plano de rede empresarial (serviço) 203.

[0053] O plano da rede de gerenciamento 201 é configurado para acoplar com o dispositivo terminal de gerenciamento e para prover o serviço de gerenciamento.

[0054] O plano da rede de armazenamento 202 é configurado para acoplar com o dispositivo de armazenamento compartilhado secundário e para prover o serviço de armazenamento.

[0055] O plano da rede empresarial 203 é configurado para acoplar com o dispositivo de nó de computação e para prover o serviço de acesso para a VM de computação em nuvem.

[0056] Todos os nós são conectados nos três planos principais, e o módulo de gerenciamento do agrupamento 102, isto é, o Etcd na figura, corresponde ao agrupamento correspondente formado por cada plano, respectivamente.

[0057] Além de instalar o programa da VM de computação em nuvem 301, isto é, a VM na figura, cada dispositivo de nó de computação 300 compreende adicionalmente um módulo de computador Nova 302, um módulo de gerenciamento de Libvirt 303, um módulo de gerenciamento de

19 / 36 trava 304 e um módulo do nó de computação HA 305.

[0058] O módulo computador Nova-computer 302, isto é, o Nova- compute na figura, é configurado para responder diretamente a todos os processos de gerenciamento do dispositivo terminal de gerenciamento para controlar o estado de execução da VM e para comunicar com a API Hipervisora.

[0059] O módulo de gerenciamento de Libvirt 303, isto é, o Libvirt na figura, é configurado para prover o processo de gerenciamento de uma interface da API Hipervisora padrão na KVM.

[0060] O módulo de gerenciamento de trava 304, isto é, a Trava na figura, correspondido com o módulo de gerenciamento de Libvirt, é configurado para atualizar e monitorar a pulsação de trava do dispositivo de armazenamento compartilhado.

[0061] O módulo do nó de computação HA 305, isto é, HaStack- Agent na figura, é pelo menos configurado para relatar a pulsação de trava para o dispositivo terminal de gerenciamento.

[0062] O seguinte explica os componentes e os serviços da VM Nova de computação em nuvem da VM Openstack envolvidos no dispositivo terminal de gerenciamento 100 e no dispositivo de nó de computação 300.

[0063] O controlador Nova executa através do módulo de controle Nova 101, compreendendo os processos de gerenciamento da VM, tais como o Nova-api, o Nova-conductor ou o Nova-scheduler, etc. O controlador Nova é definido no dispositivo terminal de gerenciamento 100 e é principalmente configurado para gerenciar e operar o ciclo de vida útil das VMs.

[0064] A HaStack executa através do módulo HA 103, definido no dispositivo terminal de gerenciamento 100, e é configurado para gerenciar a íntegra do comportamento da HA.

[0065] O software de agrupamento executa através do módulo de gerenciamento do agrupamento 102 e o software usado compreende o Etcd, o

20 / 36 Consul, etc. O Etcd é configurado nesta modalidade. O software de agrupamento fica em combinação com o componente HaStack, definido no dispositivo terminal de gerenciamento 100, e é configurado para perceber o estado de saúde da íntegra do agrupamento para a decisão de HA, e o software de agrupamento serve com uma ponte de informação entre o módulo HA 103 e o módulo do nó de computação HA 305.

[0066] O Nova-compute, um processo Nova nativo, executa através do módulo computador Nova-computer 302. O Nova-compute é definido no dispositivo de nó de computação 300 e é configurado para responder a cada processo de gerenciamento do nó de controle. O Nova-compute é o executor real da operação de gerenciamento do ciclo de vida útil da VM e é diretamente responsável por várias comunicações com o Hipervisor.

[0067] A HaStack-Agent, em combinação com o processo Nova- compute, executa através do módulo do nó de computação HA 305. A HaStack-Agent é definida no dispositivo de nó de computação 300 e é principalmente responsável pela montagem do diretório compartilhado, relato do estado da pulsação de trava deste nó, e cooperação com o componente HaStack para completar a função de gerenciamento das ações de HA parciais.

[0068] O Libvirt, definido no dispositivo de nó de computação 300, executa através do módulo de gerenciamento de Libvirt 303. O Libvirt provê um processo de gerenciamento de uma interface da API Hipervisora padrão na VM.

[0069] A Trava, executada pelo módulo de gerenciamento de trava 304, é definida no dispositivo de nó de computação 300. A Trava coopera com o componente Libvirt, e fica localizada na camada superior do dispositivo de armazenamento compartilhado 500, para completar a atualização e o monitoramento das várias pulsações de trava. A Trava é configurada para prover as travas de leitura-gravação distribuídas para controlar e gerenciar as gravações concorrentes no mesmo armazenamento. O

21 / 36 módulo de trava inovador na modalidade é um gerenciador de trava de leitura- gravação distribuída inovadoramente inventado em relação à função de Trava nativa. O módulo de Trava nativo também pode ser usado conforme necessário, ou fazer o redesenvolvimento adaptativo (desenvolvimento secundário) para a Trava nativa.

[0070] O sistema de armazenamento compartilhado, executado pelo dispositivo de armazenamento compartilhado 400, que adota os programas de software que compreendem o CephFS, o NFS e o sistema, provê o armazenamento do sistema de arquivos compartilhado.

[0071] Da forma mostrada na figura 2, o método em que o módulo HA 103 executa o gerenciamento de HA compreende as seguintes operações: Operação A-1, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação A-2.

[0072] Especificamente, a HaStack verifica se o estado do agrupamento está normal. Se anormal, o alarme de agrupamento anormal é disparado, e esta verificação é terminada; se normal, ir para a Operação A-2.

[0073] Operação A-2, verificar o estado relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a próxima Operação A-3.

[0074] Especificamente, a HaStack verifica o estado dos três planos da rede de gerenciamento relatado por cada nó através do HaStack-Agent; se tudo normal, esta verificação é terminada; caso contrário, ir para a Operação A-3.

[0075] Operação A-3, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades (estados anormais) precisam ser manipuladas uma por uma; se nenhuma manipulação for exigida, o dispositivo de nó de

22 / 36 computação finaliza a manipulação da anormalidade e retorna para a prévia Operação A-2; caso contrário, ir para a próxima Operação A-4.

[0076] Especificamente, a HaStack manipula os nós anormais um por um e, de acordo com qual plano de rede é interrompido em cada nó, compara a matriz da estratégia de HA para determinar a estratégia de manipulação subsequente. Se nenhuma manipulação for exigida, o nó finaliza a manipulação da anormalidade e retorna para a operação A-3; caso contrário, se manipulação subsequente for exigida, ir para a Operação A-4.

[0077] Operação A-4, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, o programa da VM de computação em nuvem em execução no dispositivo de nó de computação é controlado pelo módulo de controle Nova para interromper a execução, e finalizar, caso contrário, ir para a próxima Operação A-5.

[0078] Especificamente, a HaStack verifica o estado de trabalho do dispositivo de armazenamento compartilhado 400. Se o dispositivo de armazenamento compartilhado 400 estiver anormal neste momento, a HA não pode ser disparada, isto é, a VM de computação em nuvem não está em execução, e esta manipulação é finalizada; caso contrário, se o armazenamento estiver normal, ir para a Operação A-5.

[0079] Operação A-5, emitir uma solicitação de Vedação para o dispositivo de nó de computação conectado com o dispositivo de armazenamento compartilhado no estado normal; e a Vedação significa que fecha por encerramento o programa da VM de computação em nuvem deste nó.

[0080] Operação A-6, emitir um comando para o módulo de controle Nova para disparar o programa da VM de computação em nuvem em execução no dispositivo de nó de computação para executar.

23 / 36

[0081] Da forma mostrada na figura 4, em virtude da falha de armazenamento do dispositivo de armazenamento compartilhado básico 400, a pulsação de trava do módulo de Trava não pode ser gravado na hora. Neste momento, a HaStack-Agent e a HaStack precisam confirmar se a Vedação precisa ser realizada. Neste momento, é exigido que o módulo do nó de computação HA execute um método que compreende as seguintes operações: Operação C-1, quando a VM atualizar e armazenar continuamente a pulsação de trava, nenhuma manipulação é exigida se a gravação da pulsação de trava estiver normal; caso contrário, uma vez que a gravação da pulsação de trava estiver anormal, ir para a Operação C-2.

[0082] Especificamente, no dispositivo de nó de computação, a VM atualiza continuamente a pulsação de trava do módulo de Trava e armazena o mesmo; se a gravação no armazenamento estiver normal, nenhuma manipulação é exigida; caso contrário, uma vez que o tempo de gravação anormal da pulsação de trava estiver além do tempo especificado, ir para a Operação C-2.

[0083] Operação C-2, o módulo de gerenciamento de trava relata os eventos de armazenamento anormais para o dispositivo terminal de gerenciamento e espera pelo resultado da manipulação realimentado pelo dispositivo terminal de gerenciamento.

[0084] Especificamente, o módulo de Trava notifica a HaStack-Agent, relata os eventos de armazenamento anormais básicos para a HaStack, e espera pela HaStack para prover o resultado da manipulação.

[0085] Operação C-3, se o dispositivo terminal de gerenciamento retornar o resultado da manipulação em um tempo especificado, ir para a Operação C-5; caso contrário, ir para a Operação C-4; Especificamente, se a HaStack retornar o resultado da manipulação em um tempo especificado, ir para a Operação C-5; caso contrário, ir para a Operação C-4.

24 / 36

[0086] Operação C-4, se o dispositivo terminal de gerenciamento falhar em retornar o resultado da manipulação no tempo especificado, o módulo de gerenciamento de trava realiza uma operação de Vedação; isto é, fecha por encerramento o programa da VM de computação em nuvem do dispositivo de nó de computação.

[0087] Especificamente, uma vez que a HaStack falhar em retornar os resultados na hora, a Trava realiza a operação de Vedação de acordo com as definições padrões, isto é, fecha por encerramento todas as VMs em execução no nó de computação.

[0088] Operação C-5, o módulo de gerenciamento de trava determina se a Vedação é exigida de acordo com o resultado da manipulação retornado pelo dispositivo terminal de gerenciamento. Modalidade 2

[0089] Com base na modalidade 1 exposta, da forma mostrada na figura 3, depois que o dispositivo terminal de gerenciamento 100 emitir a solicitação de Vedação para o dispositivo de nó de computação conectado com o dispositivo de armazenamento compartilhado no estado normal, a HaStack precisa responder ao evento de interrupção de armazenamento relatado pela HaStack-Agent básica de acordo com o estado atual do ambiente, para o qual o módulo HA pode executar adicionalmente as seguintes operações: Operação B-1, monitorar continuamente os eventos de Vedação relatados pelo dispositivo de nó de computação; e, uma vez que houver mensagem recebida, ir para a Operação B-2.

[0090] Especificamente, a HaStack monitora continuamente os eventos de Vedação relatados pela HaStack-Agent; e uma vez que a HaStack receber uma mensagem, ir para a Operação B-2.

[0091] Operação B-2, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de

25 / 36 gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação B-3.

[0092] Especificamente, a HaStack verifica se o estado de agrupamento está normal. Se anormal, o alarme de agrupamento anormal é disparado, e esta verificação é finalizada; se normal, ir para a Operação B-3.

[0093] Operação B-3, verificar o estado da rede relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a Operação B-4.

[0094] Especificamente, a HaStack verifica o estado dos três planos da rede de gerenciamento relatado por cada nó através do HaStack-Agent.

[0095] Operação B-4, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades (estado anormal) precisam ser manipuladas; se nenhuma manipulação for exigida, ir para a Operação B-6; caso contrário, ir para a Operação B-5.

[0096] A HaStack manipula os nós anormais um por um. De acordo com o tipo de interrupção específico de cada nó, a HaStack compara a matriz da estratégia de HA para determinar a subsequente estratégia de manipulação de Vedação; se nenhuma manipulação for exigida, ir para a Operação B-6; caso contrário, se manipulação subsequente for exigida, ir para a Operação B-

5.

[0097] Operação B-5, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o dispositivo de armazenamento compartilhado estiver anormal, Vedação não é exigida e ir para a Operação B-6, e finalizar; caso contrário, ir para a Operação B-7.

[0098] Especificamente, a HaStack verifica o estado do armazenamento. Se o estado do armazenamento estiver anormal, a Vedação não é exigida, ir para a Operação B-6; caso contrário, ir para a Operação B-7.

26 / 36

[0099] Operação B-6, para um cenário no qual a Vedação não é exigida, emitir uma solicitação de interrupção de Vedação para o correspondente dispositivo de nó de computação.

[00100] Especificamente, para o cenário em que a Vedação não é exigida, a HaStack emite uma solicitação de interrupção de Vedação para a HaStack-Agent.

[00101] Operação B-7, para o cenário no qual a Vedação é exigida, emitir uma solicitação de execução de Vedação para o correspondente dispositivo de nó de computação.

[00102] Especificamente, para o cenário em que a Vedação é exigida, a HaStack emite uma solicitação de execução de Vedação para a HaStack- Agent. Modalidade 3

[00103] Com base na modalidade 1 e na modalidade 2 expostas, da forma mostrada na figura 5, em virtude de dados em grande quantidade da Trava ser armazenados na memória, não se tem persistência de dados. Portanto, se o módulo ou o processo de Trava forem reiniciados de forma anormal, todos os recursos originalmente montados no espaço de Trava serão esvaziados, o que irá fazer com que todas as VMs originais fiquem off-line. Neste caso, o processo do módulo de gerenciamento de trava precisa recuperar depois do reinício, e o processo de recuperação compreende as seguintes operações: Operação D-1, quando o módulo de gerenciamento de Libvirt for iniciado, registrar e obter a pulsação de trava através do módulo de gerenciamento de trava; se o registro falhar, ir para a Operação D-2.

[00104] Especificamente, o Libvirt registra e obtém a pulsação de trava através da Trava na inicialização e, uma vez que falhe, ir para a Operação D-

2.

[00105] Operação D-2, uma vez que o registro da pulsação de trava

27 / 36 falhar, fechar por encerramento o programa da VM de computação em nuvem do dispositivo de nó de computação.

[00106] Operação D-3, o módulo de gerenciamento de Libvirt grava todos os dispositivos do nó de computação do programa da VM de computação em nuvem que são fechados por encerramento, e grava os mesmos em arquivos de registro de Vedação.

[00107] Operação D-4, verificar periodicamente os arquivos de registro de Vedação e, se houver uma atualização verificada, ir para a Operação D-5.

[00108] Especificamente, a HaStack-Agent verifica o registro de Vedação no nó regularmente e vai para a Operação D-5 uma vez que as atualizações forem verificadas.

[00109] Operação D-5, relatar os arquivos de registro de Vedação de todos os dispositivos do nó de computação para o dispositivo terminal de gerenciamento; se o relato falhar, finalizar esta manipulação e deixar para o próximo relato; caso contrário, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento emite as instruções para a recuperação.

[00110] Especificamente, a HaStack-Agent relata todos os registros de Vedação para a HaStack. Se o relato falhar, a manipulação é finalizada e os registros são deixados para o próximo relato. Modalidade 4

[00111] Com base na modalidade 3 exposta, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento realiza as seguintes operações específicas: Operação D-6, o dispositivo terminal de gerenciamento recebe os arquivos de registro de Vedação relatados pelo dispositivo de nó de computação do agente, e determina se a manipulação automática é exigida; se a manipulação automática for exigida, ir para a Operação D-8; e, se a manipulação automática não for exigida, ir para a Operação D-7.

28 / 36

[00112] Especificamente, a HaStack recebe o registro de Vedação relatado pelo agente, e determina se realiza-se a manipulação automática de acordo com a comutação de manipulação pré-configurada: se a manipulação automática for exigida, ir para a Operação D-8; se não exigida, ir para a Operação D-7.

[00113] Operação D-7, o dispositivo terminal de gerenciamento envia um alarme que deve ser manipulado manualmente.

[00114] Especificamente, a HaStack não recupera automaticamente todas as VMs de Vedação, apenas relata os alarmes, e os alarmes serão manualmente restaurados por administradores subsequentes.

[00115] Operação D-8, o dispositivo terminal de gerenciamento manipula automaticamente o programa da VM de computação em nuvem em Vedação e invoca a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

[00116] Especificamente, a HaStack precisa manipular automaticamente a VM em Vedação, e irá invocar a interface Nova uma por uma para disparar o processo de recuperação de HA. Modalidade 5

[00117] Adicionalmente, com base nas modalidades expostas 1 a 4, o programa da VM de computação em nuvem tem o sistema operacional GuestOS da VM, que realiza as seguintes operações de recuperação depois da Vedação: Operação E-1, o Qga no sistema GuestOS da VM e o módulo do nó de computação HA do dispositivo de nó de computação mantêm a pulsação de trava continuamente; quando o programa da VM de computação em nuvem falhar, ir para a Operação E-2.

[00118] Especificamente, o Qga no GuestOS da VM irá manter a pulsação com a HaStack-Agent do nó de computação e, uma vez que a tela azul ou o paralização ocorrerem na VM, ir para a Operação E-2.

29 / 36

[00119] Operação E-2, quando o módulo do nó de computação HA receber o relato de eventos anormais, o mesmo relata para o dispositivo terminal de gerenciamento.

[00120] Especificamente, quando a HaStack-Agent receber os eventos anormais, o mesmo irá relatar os eventos para a HaStack imediatamente.

[00121] Operação E-3, depois de receber o relato dos eventos anormais, o dispositivo terminal de gerenciamento invoca diretamente a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

[00122] Especificamente, depois de receber os eventos anormais no interior da VM, a HaStack emite diretamente o comando da HA para o Nova para disparar a recuperação de HA. Modalidade 6

[00123] Da forma mostrada na figura 2, o método de gerenciamento do dispositivo terminal de gerenciamento de HA da VM Openstack para impedir split-brain compreende as seguintes operações: Operação A-1, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada; se anormal, disparar o alarme de agrupamento anormal e finalizar; se normal, ir para a Operação A-2; Operação A-2, verificar o estado relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a próxima Operação A-3; Operação A-3, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades (estados anormais) precisam ser manipuladas uma por uma; se nenhuma manipulação for exigida, finalizar a manipulação da anormalidade do dispositivo de nó de computação e retornar para a prévia Operação A-2; caso contrário, ir para a próxima Operação A-4;

30 / 36 Operação A-4, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, o programa da VM de computação em nuvem em execução no dispositivo de nó de computação é controlado pelo módulo de controle Nova para interromper a execução, e finalizar; caso contrário, ir para a próxima Operação A-5; Operação A-5, emitir uma solicitação de Vedação para o dispositivo de nó de computação conectado com o dispositivo de armazenamento compartilhado no estado normal; Operação A-6, emitir um comando para o módulo de controle Nova para disparar o programa da VM de computação em nuvem em execução no dispositivo de nó de computação para executar. Modalidade 7

[00124] Com base na modalidade 6 exposta, da forma mostrada na figura 3, depois que o dispositivo terminal de gerenciamento emitir a solicitação de Vedação para o dispositivo de nó de computação conectado com o dispositivo de armazenamento compartilhado no estado normal, o módulo HA pode executar adicionalmente as seguintes operações: Operação B-1, monitorar continuamente os eventos de Vedação relatados pelo dispositivo de nó de computação; e, uma vez que houver mensagem recebida, ir para a Operação B-2; Operação B-2, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação B-3; Operação B-3, verificar o estado da rede relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a Operação B-4;

31 / 36 Operação B-4, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades (estados anormais) precisam ser manipuladas; se nenhuma manipulação for exigida, ir para a Operação B-6; caso contrário, ir para a Operação B-5; Operação B-5, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, Vedação não é exigida, ir para a Operação B-6, e finalizar; caso contrário, ir para a Operação B-7; Operação B-6, para um cenário no qual Vedação não é exigida, emitir uma solicitação de interrupção de Vedação para o correspondente dispositivo de nó de computação; Operação B-7, para um cenário no qual Vedação é exigida, emitir uma solicitação de execução de Vedação para o correspondente dispositivo de nó de computação. Modalidade 8

[00125] Da forma mostrada na figura 4, o método de gerenciamento do dispositivo de nó de computação de HA da VM Openstack para impedir split- brain compreende as seguintes operações: Operação C-1, quando a VM atualizar e armazenar continuamente a pulsação de trava, nenhuma manipulação é exigida se a gravação da pulsação de trava estiver normal; caso contrário, uma vez que a gravação da pulsação de trava estiver anormal, ir para a Operação C-2; Operação C-2, o módulo de gerenciamento de trava relata os eventos de armazenamento anormais para o dispositivo terminal de gerenciamento e espera pelo resultado da manipulação realimentado pelo dispositivo terminal de gerenciamento;

32 / 36 Operação C-3, se o dispositivo terminal de gerenciamento retornar o resultado da manipulação em um tempo especificado, ir para a Operação C-5; caso contrário, ir para a Operação C-4; Operação C-4, se o dispositivo terminal de gerenciamento falhar em retornar o resultado da manipulação no tempo especificado, o módulo de gerenciamento de trava realiza uma operação de Vedação; isto é, fecha por encerramento ou veda (isola) o programa da VM de computação em nuvem do dispositivo de nó de computação; Operação C-5, o módulo de gerenciamento de trava determina se a Vedação é exigida de acordo com o resultado da manipulação retornado pelo dispositivo terminal de gerenciamento. Modalidade 9

[00126] Com base na modalidade 8 exposta, o processo de recuperação depois do reinício do módulo de gerenciamento de trava compreende as seguintes operações: Operação D-1, quando o módulo de gerenciamento de Libvirt for iniciado, registrar e obter a pulsação de trava através do módulo de gerenciamento de trava; se o registro falhar, ir para a Operação D-2; Operação D-2, uma vez que o registro da pulsação de trava falhar, fechar por encerramento o programa da VM de computação em nuvem do dispositivo de nó de computação; Operação D-3, o módulo de gerenciamento de Libvirt grava todos os dispositivos do nó de computação do programa da VM de computação em nuvem que são fechados por encerramento, e grava os mesmos em arquivos de registro de Vedação; Operação D-4, verificar periodicamente os arquivos de registro de Vedação, e ir para a Operação D-5 se houver uma atualização verificada; Operação D-5, relatar os arquivos de registro de Vedação de todos os dispositivos do nó de computação para o dispositivo terminal de

33 / 36 gerenciamento; se o relato falhar, finalizar esta manipulação e deixar para o próximo relato; caso contrário, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento emite as instruções para a recuperação. Modalidade 10

[00127] Com base na modalidade 8 e na modalidade 9 expostas, as seguintes operações de recuperação são realizadas depois da Vedação: Operação E-1, o Qga no sistema GuestOS da VM e o módulo do nó de computação HA do dispositivo de nó de computação mantêm a pulsação de trava continuamente; quando o programa da VM de computação em nuvem falhar, ir para a Operação E-2; Operação E-2, quando o módulo do nó de computação HA receber o relato de eventos anormais, o mesmo relata para o dispositivo terminal de gerenciamento; Operação E-3, depois de receber o relato de eventos anormais, o dispositivo terminal de gerenciamento invoca diretamente a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

[00128] A falha compreende as ocorrências de tela azul, paralização ou interrupção fatal do dispositivo de nó de computação em que o programa da VM de computação em nuvem executa. Função e efeito da modalidade

[00129] A presente invenção realiza o desenvolvimento secundário com base na versão de Openstack nativo. Através da integração de diversas tecnologias chaves, um sistema HA de uma VM Openstack para impedir split- brain foi independentemente desenvolvido. A invenção se livrou da dependência da detecção do plano IPMI ou do hardware dog, etc. na tradicional solução de HA, e realizou a completa tecnologia HA de VM da confiabilidade no nível da telecomunicação. Por este motivo, a invenção

34 / 36 provê um melhor sistema HA de uma VM Openstack para impedir split-brain.

[00130] No sistema de computação em nuvem, a split-brain significa que, em um sistema HA (HA), quando dois nós de controle ou nós de computação conectados forem desconectados, o sistema que é originalmente um todo é dividido em dois nós independentes. Neste momento, os dois nós começam a embaralhar por recursos compartilhados, resultando em confusão do sistema e dano aos dados. Os melhores dispositivo terminal de gerenciamento de HA e método de gerenciamento de uma VM Openstack para impedir a split-brain providos pela melhoria da presente invenção podem resolver este problema.

[00131] De acordo com o sistema HA da VM Openstack para impedir split-brain provido pela modalidade, em virtude do módulo HA, pode-se executar o método de gerenciamento de HA. Através de uma série de operações de A-1 até A-6, as detecções de alta disponibilidade do estado do dispositivo de nó de computação conectado e do dispositivo de armazenamento compartilhado podem ser realizadas em tempo real. De acordo com o tipo de estado anormal, pode ser aprendido: a anormalidade do dispositivo de nó de computação ou qual do dispositivo de armazenamento compartilhado e, em particular, a qual parte da rede de gerenciamento está anormal: o plano da rede de gerenciamento, o plano da rede de armazenamento, ou o plano da rede empresarial; e, então, se realiza-se a operação de Vedação para fechar o programa da VM de computação em nuvem correspondente ao dispositivo de nó de computação anormal depois do julgamento pode ser decidido, desse modo, garantindo a HA do programa da VM de computação em nuvem do dispositivo de nó de computação no sistema.

[00132] Em virtude do módulo do nó de computação HA, que pode executar uma série de operações de C-1 a C-5, atualização e armazenamento da pulsação de trava da trava de leitura-gravação de trava distribuída em

35 / 36 tempo real, relato da falha de gravação durante a atualização para o dispositivo terminal de gerenciamento em tempo real, e operação de acordo com o resultado da manipulação do dispositivo terminal de gerenciamento: se adota-se Vedação para fechar ou vedar (isolar) o programa da VM de computação em nuvem do dispositivo de nó de computação, para refinar a intensidade da proteção de trava da trava de leitura-gravação distribuída do nível do hospedeiro do dispositivo de nó de computação para o nível da VM, que pode prover proteção de leitura-gravação concorrente para uma única VM.

[00133] A fim de proibir múltiplas VMs de gravar discos ao mesmo tempo, a pulsação de trava é usado para impedir fundamentalmente a ocorrência de “split-brain”.

[00134] A intensidade da proteção de trava de trava de leitura-gravação de trava distribuída é refinada do nível do hospedeiro do dispositivo de nó de computação para o nível da VM, que pode prover proteção de leitura- gravação concorrente para uma única VM.

[00135] O mecanismo de proteção de Vedação da VM autoinventado compreende a íntegra do processo, através do qual pode-se impedir o término anormal da VM devido à falha do dispositivo de armazenamento compartilhado ou outras falhas a afetar a pulsação de trava básica.

[00136] No processo, o mecanismo de notificação assíncrona é adotado para resolver o problema do tropeço da HA de VM causado por reinício de Trava e, então, realizar recuperação automática.

[00137] Adicionalmente, o serviço HaStack, independente do Openstack original, é independentemente desenvolvido. A HaStack é configurada para gerenciar a íntegra do agendamento da HA. Através da integração do Etcd e do Qga, a HaStack realiza a precisa percepção do estado de saúde e do estado de execução interna da VM dos três planos (o plano da rede de gerenciamento, o plano da rede empresarial e o plano da rede de

36 / 36 armazenamento) da rede de gerenciamento de todos os hospedeiros básica:

1. através do ajuste do período e da mensagem da pulsação para confirmar rapidamente os pontos de falha do plano físico do dispositivo de nó de computação, a base do julgamento com alta precisão é provida para que a HaStack tome decisões;

2. para todos os tipos de anormalidades nos três planos da rede de gerenciamento do único dispositivo de nó de computação, através do esquema da manipulação correspondente à falha de HA configurável, o usuário pode definir a estratégia de recuperação de HA customizada para o esquema correspondente;

3. o Qga de integração é usado para monitorar a saúde da VM. Uma vez que a tela azul, o paralização ou outra falha ocorrerem no interior da VM, a recuperação de HA é disparada imediatamente para realizar a autorregeneração;

4. para todos os tipos de anormalidades no agrupamento, armazenamento e conexão em rede, os mecanismos de proteção correspondentes são adicionados.

[00138] As modalidades expostas são casos preferidos da presente invenção, e não se pretende que limitem o escopo de proteção da presente invenção.

Claims

REIVINDICAÇÕES

1. Sistema de alta disponibilidade (HA) de uma máquina virtual (VM) Openstack para impedir split-brain, caracterizado pelo fato de que compreende: um dispositivo terminal de gerenciamento, uma rede de gerenciamento, um dispositivo de nó de computação e um dispositivo de armazenamento compartilhado; em que pelo menos dois dispositivos terminais de gerenciamento se comunicam através da rede de gerenciamento para formar um agrupamento de gerenciamento; o dispositivo terminal de gerenciamento e o dispositivo de nó de computação ficam em conexão de comunicação através da rede de gerenciamento; o dispositivo de nó de computação é conectado no dispositivo de armazenamento compartilhado; cada dispositivo terminal de gerenciamento compreende: um módulo de controle Nova, que compreende o processo de gerenciamento de VM nativo de Nova, configurado para gerenciar o ciclo de vida útil da VM; um módulo de gerenciamento do agrupamento, configurado para coletar a informação do estado de execução do agrupamento; e um módulo HA, configurado para realizar o gerenciamento de HA para todos os dispositivos do nó de computação; um método que o módulo HA executa o gerenciamento de HA, que compreende as seguintes operações: Operação A-1, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação A-2; Operação A-2, verificar o estado relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a próxima Operação A-3; Operação A-3, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades precisam ser manipuladas uma por uma; se nenhuma manipulação for exigida, finalizar a manipulação da anormalidade do dispositivo de nó de computação e retornar para a prévia Operação A-2; caso contrário, ir para a próxima Operação A-4; Operação A-4, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado for anormal, o programa da VM de computação em nuvem em execução no dispositivo de nó de computação é controlado pelo módulo de controle Nova para interromper a execução, e finalizar; caso contrário, ir para a próxima Operação A-5; Operação A-5, emitir uma solicitação de Vedação para o dispositivo de nó de computação conectado com o estado normal do dispositivo de armazenamento compartilhado; Operação A-6, emitir um comando para o módulo de controle Nova para disparar o programa da VM de computação em nuvem em execução no dispositivo de nó de computação para executar; além do programa da VM de computação em nuvem, o dispositivo de nó de computação compreende adicionalmente: um módulo de computador Nova, configurado para responder diretamente a todos os processos de gerenciamento do dispositivo terminal de gerenciamento para controlar o estado de execução da VM e para comunicar com a API Hipervisora; um módulo de gerenciamento de Libvirt, configurado para prover o processo de gerenciamento de uma interface da API Hipervisora padrão na KVM; um módulo de gerenciamento de trava, correspondido com o módulo de gerenciamento de Libvirt, configurado para atualizar e monitorar a pulsação de trava do dispositivo de armazenamento compartilhado; e um módulo do nó de computação HA, pelo menos configurado para relatar a pulsação de trava para o dispositivo terminal de gerenciamento; em que um método para executar o módulo do nó de computação HA compreende as seguintes operações: Operação C-1, quando a VM atualizar e armazenar continuamente a pulsação de trava, nenhuma manipulação é exigida se a gravação da pulsação de trava estiver normal; caso contrário, uma vez que a gravação da pulsação de trava estiver anormal, ir para a Operação C-2; Operação C-2, o módulo de gerenciamento de trava relata os eventos de armazenamento anormais para o dispositivo terminal de gerenciamento e espera pelo resultado da manipulação realimentado pelo dispositivo terminal de gerenciamento; Operação C-3, se o dispositivo terminal de gerenciamento retornar o resultado da manipulação no tempo especificado, ir para a Operação C-5; caso contrário, ir para a Operação C-4; Operação C-4, se o dispositivo terminal de gerenciamento falhar em retornar o resultado da manipulação no tempo especificado, o módulo de gerenciamento de trava realiza uma operação de Vedação; Operação C-5, o módulo de gerenciamento de trava determina se a Vedação é exigida de acordo com o resultado da manipulação retornado pelo dispositivo terminal de gerenciamento.

2. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 1, caracterizado pelo fato de que, depois que o dispositivo terminal de gerenciamento emitir a solicitação de Vedação para o dispositivo de nó de computação conectado com o estado normal do dispositivo de armazenamento compartilhado, o módulo HA executa adicionalmente as seguintes operações: Operação B-1, monitorar continuamente os eventos de Vedação relatados pelo dispositivo de nó de computação; e, uma vez que houver mensagem recebida, ir para a Operação B-2; Operação B-2, verificar se o estado de agrupamento está normal através da informação do estado de execução coletada pelo módulo de gerenciamento do agrupamento; se anormal, disparar o alarme de agrupamento anormal e finalizar; e, se normal, ir para a Operação B-3; Operação B-3, verificar o estado da rede relatado por cada dispositivo de nó de computação através da rede de gerenciamento; se normal, terminar esta verificação; caso contrário, ir para a Operação B-4; Operação B-4, de acordo com os estados anormais relatados por cada dispositivo de nó de computação através da rede de gerenciamento, julgar se as anormalidades precisam ser manipuladas; se nenhuma manipulação for exigida, ir para a Operação B-6; caso contrário, ir para a Operação B-5; Operação B-5, para o dispositivo de nó de computação com estado anormal que precisa ser manipulado, verificar o estado do dispositivo de armazenamento compartilhado conectado no mesmo; quando o estado do dispositivo de armazenamento compartilhado estiver anormal, Vedação não é exigida, ir para a Operação B-6, e finalizar; caso contrário, ir para a Operação B-7; Operação B-6, para um cenário no qual Vedação não é exigida, emitir uma solicitação de interrupção de Vedação para o correspondente dispositivo de nó de computação; Operação B-7, para um cenário no qual Vedação é exigida, emitir uma solicitação de execução de Vedação para o correspondente dispositivo de nó de computação; o processo de recuperação depois do reinício do módulo de gerenciamento de trava, que compreende as seguintes operações: Operação D-1, quando o módulo de gerenciamento de Libvirt for iniciado, registrar e obter a pulsação de trava através do módulo de gerenciamento de trava; se o registro falhar, ir para a Operação D-2; Operação D-2, uma vez que o registro da pulsação de trava falhar, fechar ou vedar o programa da VM de computação em nuvem do dispositivo de nó de computação; Operação D-3, o módulo de gerenciamento de Libvirt grava todos os dispositivos do nó de computação do programa da VM de computação em nuvem que são fechados ou vedados, e grava os mesmos em arquivos de registro de Vedação; Operação D-4, verificar periodicamente os arquivos de registro de Vedação, e ir para a Operação D-5 se houver uma atualização verificada; Operação D-5, relatar os arquivos de registro de Vedação de todos os dispositivos do nó de computação para o dispositivo terminal de gerenciamento; se o relato falhar, finalizar esta manipulação e deixar para o próximo relato; caso contrário, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento emite as instruções para a recuperação.

3. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 1, caracterizado pelo fato de que, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento realiza as seguintes operações específicas: Operação D-6, o dispositivo terminal de gerenciamento recebe os arquivos de registro de Vedação relatados pelo dispositivo de nó de computação, e determina se a manipulação automática é exigida; se a manipulação automática for exigida, ir para a Operação D-8; e, se a manipulação automática não for exigida, ir para a Operação D-7; Operação D-7, o dispositivo terminal de gerenciamento envia um alarme que deve ser manipulado manualmente; Operação D-8, o dispositivo terminal de gerenciamento manipula automaticamente o programa da VM de computação em nuvem vedado e invoca a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

4. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 1, caracterizado pelo fato de que o dispositivo de armazenamento compartilhado é gerenciado e executado por um programa de gerenciamento de arquivo CephFS ou NFS; o processo de gerenciamento de VM compreende Nova-api, Nova-conductor ou Nova-scheduler; o módulo de gerenciamento do agrupamento compreende Etcd ou Consul.

5. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 1, caracterizado pelo fato de que a rede de gerenciamento compreende: um plano da rede de gerenciamento, configurado para acoplar com o dispositivo terminal de gerenciamento e para prover o serviço de gerenciamento; um plano da rede de armazenamento, configurado para acoplar com o dispositivo de armazenamento compartilhado secundário e para prover o serviço de armazenamento; um plano da rede empresarial, configurado para acoplar com o dispositivo de nó de computação e para prover o serviço de acesso para a VM de computação em nuvem.

6. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 5, caracterizado pelo fato de que apenas quando o plano da rede de gerenciamento, o plano da rede de armazenamento e o plano da rede empresarial da rede de gerenciamento estiverem todos normais, o estado da rede relatado pelo dispositivo de nó de computação na Operação A-2 através da rede de gerenciamento será julgado como normal; caso contrário, de acordo com o tipo de interrupção específico do dispositivo de nó de computação que está anormal, julgar que um ou mais do plano da rede de gerenciamento, do plano da rede de armazenamento e do plano da rede empresarial devem ser manipulados e, então, tratar desta maneira.

7. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 2, caracterizado pelo fato de que a rede de gerenciamento compreende: um plano da rede de gerenciamento, configurado para acoplar com o dispositivo terminal de gerenciamento e para prover o serviço de gerenciamento; um plano da rede de armazenamento, configurado para acoplar com o dispositivo de armazenamento compartilhado secundário e para prover o serviço de armazenamento; um plano da rede empresarial, configurado para acoplar com o dispositivo de nó de computação e para prover o serviço de acesso para a VM de computação em nuvem; correspondentemente, quando o plano da rede de gerenciamento, o plano da rede de armazenamento e o plano da rede empresarial da rede de gerenciamento estiverem todos normais, o estado da rede relatado pelo dispositivo de nó de computação na Operação B-3 através da rede de gerenciamento será julgado como normal; caso contrário, de acordo com o tipo de interrupção específico do dispositivo de nó de computação que está anormal, julgar que um ou mais do plano da rede de gerenciamento, do plano da rede de armazenamento e do plano da rede empresarial devem ser manipulados e, então, realizar a correspondente manipulação de Vedação.

8. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 1, caracterizado pelo fato de que o programa da VM de computação em nuvem tem um sistema operacional GuestOS da VM, que realiza as seguintes operações de recuperação depois da Vedação: Operação E-1, o Qga no sistema GuestOS da VM e o módulo do nó de computação HA do dispositivo de nó de computação mantêm a pulsação de trava continuamente; quando o programa da VM de computação em nuvem falhar, ir para a Operação E-2; Operação E-2, quando o módulo do nó de computação HA receber o relato de eventos anormais, o mesmo relata para o dispositivo terminal de gerenciamento; Operação E-3, depois de receber o relato de eventos anormais, o dispositivo terminal de gerenciamento invoca diretamente a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.

9. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 8, caracterizado pelo fato de que a falha compreende a ocorrência de tela azul ou paralização ou interrupção fatal do dispositivo de nó de computação, no qual o programa da VM de computação em nuvem está em execução.

10. Sistema de alta disponibilidade (HA) da máquina virtual (VM) Openstack para impedir split-brain de acordo com a reivindicação 2, caracterizado pelo fato de que, depois que os arquivos forem relatados para o dispositivo terminal de gerenciamento, o dispositivo terminal de gerenciamento realiza as seguintes operações específicas: Operação D-6, o dispositivo terminal de gerenciamento recebe os arquivos de registro de Vedação relatados pelo dispositivo de nó de computação, e determina se a manipulação automática é exigida; se a manipulação automática for exigida, ir para a Operação D-8, e, se a manipulação automática não for exigido, ir para a Operação D-7; Operação D-7, o dispositivo terminal de gerenciamento envia um alarme que deve ser manipulado manualmente; Operação D-8, o dispositivo terminal de gerenciamento manipula automaticamente o programa da VM de computação em nuvem vedado e invoca a interface Nova para controlar o programa da VM de computação em nuvem para recuperar a execução novamente.