BR112017001171B1

BR112017001171B1 - Método executado em um dispositivo de computação, dispositivo de computação e dispositivo de memória legível por computador para recuperar a operacionalidade de um serviço baseado em nuvem

Info

Publication number: BR112017001171B1
Application number: BR112017001171-9A
Authority: BR
Inventors: Art Sadovsky; Timur Sadykov; Ashish Premaraj; Venkat Narayanan; Smita Ojha
Original assignee: Microsoft Technology Licensing, Llc
Priority date: 2014-08-04
Filing date: 2015-08-04
Publication date: 2023-04-11
Also published as: CN106663041A; RU2699054C2; EP3178004B1; US9436553B2; WO2016022506A3; JP2017528807A; WO2016022506A2; IL249855A0; CA2955216A1; EP3178004A2; KR102271007B1; CL2017000264A1; KR20170041715A; CO2017000695A2; PH12017500024B1; RU2017103444A; SG11201700531SA; NZ728138A; RU2017103444A3; BR112017001171A2

Abstract

A usabilidade de um serviço baseado em nuvem é recuperada de uma falha de sistema. Uma transação de cliente associada com a experiência de cliente é executada para simular a experiência de cliente no serviço baseado em nuvem. Uma falha associada com um subsistema do serviço baseado em nuvem é detectada de uma saída da transação de cliente. Uma ação de recuperação é determinada estar associada com a falha. A ação de recuperação é executada no subsistema e monitorada para determinar um status de sucesso.

Description

ANTECEDENTES

[001] As tecnologias de computação distribuída habilitaram múltiplos recursos de computação para prover soluções coordenadas e distintas. Um exemplo de computação distribuída, a computação de nuvem reúne múltiplos sistemas para prover soluções para as necessidades de usuário. A computação de nuvem pode abranger uma vasta rede de recursos de computação. Os recursos de computação utilizados em aplicações e serviços de computação de nuvem estão dispersos através de redes e localizações. Os recursos de computação dispersos são remotamente controlados e gerenciados. Usualmente, soluções manuais proveem suporte de instalação e configuração para bens de computação de nuvem. As soluções de instalação manual por componentes humanos de recursos de computação amplamente dispersos não são econômicas.

[002] As soluções de recuperação convencionais para sistemas de computação de nuvem têm limitações. As soluções de recuperação convencionais tipicamente resolvem falhas componentes individuais de um sistema de computação de nuvem. A saúde de um componente individual é monitorada localmente. As notificações sobre a saúde de um componente individual são transmitidas para um controlador central. As soluções de recuperação convencionais também monitoram um grupamento de componentes. As ações de recuperação são transmitidas e executadas para um grupamento para resolver as falhas associadas com indivíduos no grupamento.

SUMÁRIO

[003] Este sumário está provido para introduzir uma seleção de conceitos em uma forma simplificada que ainda estão abaixo descritos na Descrição Detalhada. Este sumário não pretende exclusivamente identificar características chave ou características essenciais do assunto reivindicado nem pretende ser um auxílio na determinação do escopo do assunto reivindicado.

[004] As modalidades estão direcionadas para a recuperação de operacionalidade de um serviço baseado em nuvem de uma falha de sistema. Em algumas modalidades exemplares, um aplicativo de gerenciamento do serviço baseado em nuvem pode simular uma transação de cliente associada com uma experiência de cliente. A experiência de cliente pode incluir uma ou mais transações de cliente que formam um cenário de utilização associado com o serviço baseado em nuvem. Uma falha associada com o serviço baseado em nuvem pode ser detectada de uma saída da transação de cliente que foi simulada. A falha pode ser analisada para determinar uma ação de recuperação mapeando a falha para a ação de recuperação. A ação de recuperação pode ser executada e monitorada para determinar um status de sucesso.

[005] Estas e outras características e vantagens serão aparentes de uma leitura da descrição detalhada seguinte e uma revisão dos desenhos associados. Deve ser compreendido que tanto a descrição geral acima quanto a descrição detalhada seguinte são explanatórias e não restringem aspectos como reivindicados.

BREVE DESCRIÇÃO DOS DESENHOS

[006] Figura 1 é um diagrama conceitual que ilustra uma recuperação exemplar de um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades;

[007] Figura 2 ilustra componentes de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades;

[008] Figura 3 ilustra componentes adicionais de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades;

[009] Figura 4 ilustra características de relatório de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades;

[010] Figura 5 é um ambiente em rede simplificado, onde um sistema de acordo com modalidades pode ser implementado;

[011] Figura 6 ilustra um dispositivo de computação de uso geral, o qual pode estar configurado para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema; e

[012] Figura 7 ilustra um fluxograma lógico para um processo para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema, de acordo com modalidades.

DESCRIÇÃO DETALHADA

[013] Como brevemente acima descrito, a operacionalidade de um serviço baseado em nuvem pode ser recuperada de uma falha de sistema por um aplicativo de gerenciamento associada com um serviço baseado em nuvem. Uma transação de cliente associada com a experiência de cliente pode ser simulada para simular a experiência de cliente. Uma falha associada com o serviço baseado em nuvem pode ser detectada de uma saída da transação de cliente. Uma ação de recuperação pode ser determinada estar associada com a falha. A ação de recuperação pode ser executada e monitorada para determinar um status de sucesso.

[014] Na descrição detalhada seguinte, referências são feitas aos desenhos acompanhantes que formam uma sua parte, e nos quais estão mostradas como ilustrações modalidades ou exemplos específicos. Estes aspectos podem ser combinados, outros aspectos podem ser utilizados, e mudanças estruturais podem ser feitas sem afastar do escopo da presente descrição. A descrição detalhada seguinte portanto não deve ser tomada em um sentido limitante, e o escopo da presente invenção é definido pelas reivindicações anexas e seus equivalentes.

[015] Apesar das modalidades serem descritas no contexto geral de módulos de programa que executam em conjunto com um programa de aplicação que executa em um sistema de operação em um dispositivo de computação, aqueles versados na técnica reconhecerão que aspectos podem também ser implementados em combinação com outros módulos de programa.

[016] Geralmente, os módulos de programa incluem rotinas, programas, componentes, estruturas de dados, e outros tipos de estruturas que executam tarefas específicas ou implementam tipos de dados abstratos específicos. Mais ainda, aqueles versados na técnica apreciarão que as modalidades podem ser praticadas com outras configurações de sistema de computador, incluindo dispositivos portáteis, sistemas de multiprocessador, eletrônica de consumidor baseada em microprocessador ou programável, minicomputadores, computadores mainframe, e dispositivos de computação comparáveis. As modalidades podem também ser praticadas em ambientes de computação distribuída onde as tarefas são executadas por dispositivos de processamento remoto que estão conectados através de uma rede de comunicações. Em um ambiente de computação distribuída, os módulos de programa podem estar localizados em dispositivos de armazenamento de memória tanto locais quanto remotos.

[017] As modalidades podem ser implementadas como um processo implementado por computador (método), a sistema de computação, ou como um artigo de manufatura, tal como um produto de programa de computador ou meio legível por computador. The produto de programa de computador pode ser um meio de armazenamento de computador legível por um sistema de computador e que codifica um programa de computador que compreende instruções para fazer com que um computador ou sistema de computação execute exemplo processo(s) exemplar(es). O meio de armazenamento legível por computador é um dispositivo de memória legível por computador. O meio de armazenamento legível por computador pode, por exemplo, ser implementado através de uma ou mais de uma memória de computador volátil, uma memória não volátil, um disco rígido, e uma unidade instantânea.

[018] Através de todo este relatório descritivo, o termo "plataforma" pode ser uma combinação de componentes de software e hardware para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema. Exemplos de plataformas incluem, mas não estão limitados a, um serviço hospedado executado sobre uma pluralidade de servidores, uma aplicação executada em um único dispositivo de computação, e sistemas comparáveis. O termo "servidor" geralmente refere-se a um dispositivo de computação que executa um ou mais programas de software tipicamente em um ambiente em rede. No entanto, um servidor pode também ser implementado como um servidor virtual (programas de software) executado em um ou mais dispositivos de computação vistos como um servidor na rede. Mais detalhes sobre estas tecnologias e modalidades exemplares podem ser encontrados na descrição seguinte.

[019] A Figura 1 é um diagrama conceitual que ilustra uma recuperação exemplar de um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades.

[020] Em um diagrama 100, um serviço baseado em nuvem 106 pode prover serviços para um cliente 108 através de um dispositivo de cliente 102. O serviço baseado em nuvem 106 pode prover uma expansiva variedade de serviços através de uma interface de cliente no dispositivo de cliente 102. Os serviços podem incluir compartilhamento de documentos, serviços de e-mail, serviços de armazenamento, entre outros. Além disso, o cliente 108 (o qual está autorizado para interagir com o dispositivo de cliente 102) pode ser uma entidade que inclui uma pessoa, múltiplas pessoas, um grupo de pessoas, uma organização, entre outras.

[021] O serviço baseado em nuvem 106 pode ser uma aplicação distribuída que provê serviços através um ou mais dispositivos de computação que executam um ou mais componentes da aplicação distribuída. O um ou mais dispositivos de computação podem estar conectados através uma ou mais redes que utilizam uma infraestrutura com fio ou sem fio. Um exemplo do serviço baseado em nuvem 106 pode incluir um serviço de e-mail. O serviço de e-mail pode estar hospedado em múltiplos dispositivos de computação. O serviço de email pode ser dividido entre os dispositivos de computação com base em uma capacidade de processamento disponível de cada dispositivo de computação. Em outro cenário exemplar, o serviço baseado em nuvem 106 pode incluir um serviço de compartilhamento de documentos. O serviço de compartilhamento de documentos pode distribuir documentos armazenados através de múltiplos dispositivos de computação com base na capacidade de armazenamento disponível de cada dispositivo de computação. Os exemplos do serviço baseado em nuvem 106 como um serviço de e-mail e um serviço de compartilhamento de documentos não foram providos em um sentido limitante. O serviço baseado em nuvem 106 pode incluir qualquer solução de computação distribuída que provenha um serviço para um ou mais clientes tal como o cliente 108.

[022] O cliente 108 pode ser permitido interagir com o serviço baseado em nuvem 106 através do dispositivo de cliente 102. O dispositivo de cliente 102 pode incluir um número de dispositivos de computação tal como um computador desktop, um smartphone, um computador notebook, um computador tablet, entre outros. O cliente 108 pode interagir com o serviço baseado em nuvem 106 através de uma interface de cliente do serviço baseado em nuvem 106 que está provida pelo dispositivo de cliente 102. Alternativamente, o serviço baseado em nuvem 106 pode prover uma interface de cliente e o dispositivo de cliente 102 pode renderizar a interface de cliente dentro de uma aplicação de cliente. O cliente 108 pode interagir com a interface de cliente através de um número de modalidades de entrada que podem incluir uma ação baseada em toque 110, uma entrada baseada em teclado, uma entrada baseada em mouse, entre outras. A ação baseada em toque 110 pode incluir um número de gestos tal como uma ação de toque, uma ação de varredura, entre outras.

[023] Uma ou mais interações do cliente 108 com a interface de cliente do serviço baseado em nuvem 106 podem estar abrangidas dentro de uma experiência de cliente 104. A experiência de cliente 104 pode ser um contentor para uma ou mais tarefas de cliente. Um exemplo da experiência de cliente 104 pode incluir o cliente 108 iniciando uma interface de cliente de um serviço de e-mail e lendo um ou mais e-mails associados com uma conta de usuário do cliente 108. Outro exemplo da experiência de cliente 104 pode incluir o cliente 108 iniciando uma interface de cliente de edição de um serviço de compartilhamento de documentos para editar o documento. A experiência de cliente 104 pode também incluir o cliente 108 editando o documento e salvando o documento.

[024] Apesar do sistema exemplar na Figura 1 ter sido descrito com componentes específicos incluindo o serviço baseado em nuvem 106 e a experiência de cliente 104, as modalidades não estão limitadas a estes componentes ou configurações de sistema e podem ser implementadas com outra configuração de sistema que emprega menos ou adicionais ou componentes.

[025] A Figura 2 ilustra componentes de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades.

[026] Em um diagrama 200, um esquema para recuperar um serviço baseado em nuvem 206 com base em uma experiência de cliente 204 pode estar descrito. Um aplicativo de gerenciamento 210 pode simular uma transação de cliente 202 para determinar uma falha 212 associada com um subsistema 208 do serviço baseado em nuvem 206.

[027] O aplicativo de gerenciamento 210 pode incluir uma aplicação que monitora e gerencia o serviço baseado em nuvem 206. O aplicativo de gerenciamento 210 pode ser um componente do serviço baseado em nuvem 206. Alternativamente, o aplicativo de gerenciamento 210 pode ser uma aplicação independente que pode ser autorizada para interagir com o serviço baseado em nuvem 206.

[028] O aplicativo de gerenciamento 210 pode selecionar a experiência de cliente de um conjunto de experiências de cliente associadas com um monitoramento de saúde do serviço baseado em nuvem 206. O monitoramento de saúde do serviço baseado em nuvem 206 pode incluir processos (tal como monitoramento e resolução de funcionalidade interrompida) para operações continuadas providas pelo serviço baseado em nuvem 206. Além disso, a experiência de cliente 204 pode ser selecionada com base em um critério que inclui uma frequência de utilização, uma distribuição de utilização histórica, e quão recente a utilização da experiência de cliente 204. Em um cenário exemplar, o aplicativo de gerenciamento 210 pode selecionar a experiência de cliente 204 que é mais frequentemente utilizada de um conjunto de experiências de cliente que são classificadas com base em uma frequência de utilização. Em outro cenário exemplar, o aplicativo de gerenciamento 210 pode selecionar a experiência de cliente 204 que está no topo de uma distribuição de utilização histórica do conjunto de experiências de cliente. Em ainda outro cenário exemplar, o aplicativo de gerenciamento 210 pode selecionar a experiência de cliente 204 que é mais recentemente utilizado do conjunto de experiências de cliente que são classificadas com base em quão recente é a utilização.

[029] Alternativamente, o aplicativo de gerenciamento 210 pode receber uma seleção da experiência de cliente 204 de um conjunto de experiências de cliente associadas com um monitoramento saúde do serviço baseado em nuvem 206. A seleção pode ser feita por uma parte interessada que inclui um cliente associado com a experiência de cliente 204 ou um administrador do serviço baseado em nuvem 206.

[030] Mais ainda, a experiência de cliente 204 pode armazenar a transação de cliente 202. A transação de cliente 202 pode incluir um ou mais comandos que podem ser executados pelo serviço baseado em nuvem 206 através do subsistema 208. O subsistema 208 pode gerar uma saída durante uma simulação da transação de cliente 202. A saída pode ser utilizada para determinar uma falha associada com a transação de cliente 202.

[031] O aplicativo de gerenciamento 210 pode também determinar que a experiência de cliente 204 pode armazenar uma ou mais outras transações de cliente juntamente com a transação de cliente 202. As um ou mais outras transações de cliente podem também ser simuladas para detectar a falha 212 ou uma ou mais outras falhas associadas com o serviço baseado em nuvem 206. Um exemplo pode incluir a simulação da experiência de cliente 204 em um serviço de e-mail como um exemplo do serviço baseado em nuvem 206. A transação de cliente 202 pode incluir uma ação de iniciação de interface de e-mail. As uma ou mais outras transações de cliente podem incluir a recuperação de e-mails e renderização dos e-mails associados com a experiência de cliente 204.

[032] O subsistema 208 do serviço baseado em nuvem 206 pode simular a transação de cliente 202. A falha 212 pode ser detectada durante a simulação da transação de cliente 202. O subsistema 208 pode reportar a falha 212 através de uma saída da transação de cliente 202.

[033] Alternativamente, a falha 212 pode também ser extrapolada de dados de utilização. Os dados de utilização podem também ser referidos como dados passivos. Os dados de utilização podem incluir medições de uma ou mais transações de cliente de um cenário de utilização do serviço baseado em nuvem 206. As medições podem capturar erros associados com o cenário de utilização do serviço baseado em nuvem 206. Um dispositivo de cliente associado com o serviço baseado em nuvem 206 pode capturar os dados de utilização e transmitir os dados de utilização para uma aplicação de análise tal como o aplicativo de gerenciamento 210. O aplicativo de gerenciamento 210 pode processar os dados de utilização para detectar a falha 212 com base em um número de erros reportados pelos dados de utilização que excedem um limite. O limite pode estar configurado por uma parte interessada do serviço baseado em nuvem 206. Dados privados podem também ser removidos dos dados de utilização para tornar anônimos os dados de utilização. Um exemplo de dados privados pode incluir uma localização de um cliente, entre outros. Os dados de utilização podem também ser agregados com base em critérios comuns tais como informações de identificação de um ou mais subsistemas associados com o serviço baseado em nuvem 206 que estão falhando, entre outros.

[034] Os dados de utilização podem ser capturados em arquivos de registro pelo dispositivo de cliente e transmitidos para o aplicativo de gerenciamento 210. O aplicativo de gerenciamento 210 pode analisar os arquivos de registro para extrair as informações associadas com a falha 212. O aplicativo de gerenciamento 210 pode também recuperar os dados de utilização de outras fontes tais como os dispositivos do serviço baseado em nuvem 206. O serviço baseado em nuvem 206 pode alocar recursos para capturar as medições de cenários de utilização associados com os clientes. As medições podem ser armazenadas como os dados de utilização e tornadas disponíveis para aplicações de análise tal como o aplicativo de gerenciamento 210 para monitoramento e análise da falha 212.

[035] A Figura 3 ilustra componentes adicionais de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades.

[036] Em um diagrama 300, um aplicativo de gerenciamento 310 pode determinar a falha 312 de uma saída 314 de uma transação de cliente simulada em um serviço baseado em nuvem 306. A saída 314 pode também ser agregada com base em critérios comuns tais como as informações de identificação de um ou mais subsistemas associados com o serviço baseado em nuvem 306 que estão falhando, entre outros. A falha 312 pode ser mapeada para uma ação de recuperação 316 a qual pode ser executada em um subsistema 308 associado com a falha 312. A ação de recuperação 316 pode ser monitorada para determinar um status de sucesso 318 da ação de recuperação 316.

[037] O aplicativo de gerenciamento 310 pode executar a ação de recuperação 316 no subsistema 308 para restaurar o subsistema 308 para um status saudável. Alternativamente, a ação de recuperação 316 pode ser executada para rotear novamente um ou mais processos associados com o subsistema 308 (o subsistema falhado) para um subsistema saudável que provê uma funcionalidade de transferência automática por falha.

[038] De acordo com alguns exemplos, uma ou mais métricas associadas com a experiência de cliente podem ser rastreadas enquanto monitorando a ação de recuperação 316. As uma ou mais métricas podem incluir medições associadas com uma ou mais transações de cliente simuladas em um ou mais subsistemas do serviço baseado em nuvem 306. As métricas podem ser monitoradas durante a ação de recuperação 316 para determine que as uma ou mais métricas estão acima de um ou mais limites associados com o status de sucesso 318.

[039] Um número de disponibilidade pode ser gerado das métricas associadas com o subsistema 308 que pode estar simulando a experiência de cliente. As métricas podem ser determinadas da saída 314. A falha 312 pode ser determinada em resposta a outra determinação que o número de disponibilidade é menor do que um limite. O limite pode ser configurável por um administrador do serviço baseado em nuvem 306.

[040] O aplicativo de gerenciamento 310 pode também determinar outra ação de recuperação que está associada com a falha 312 em resposta a uma resposta a uma determinação que o status de sucesso 318 é negativo. Quando a ação de recuperação 316 falha em restaurar o subsistema 308 para um status saudável então o aplicativo de gerenciamento 310 pode recuperar a outra ação de recuperação de uma lista de ações de recuperação que coincidem com a falha 312 e executar a outra ação de recuperação. A outra ação de recuperação pode também ser monitorada para determinar o status de sucesso 318 para restaurar o subsistema 308 para um status saudável. A ação de recuperação 316 pode ser uma primeira ação de recuperação. A outra ação de recuperação pode ser uma segunda ação de recuperação.

[041] De acordo com outros exemplos, o aplicativo de gerenciamento 310 pode analisar a saída 314 para determinar um ou mais critérios. Os critérios podem incluir as informações de identificação de um ou mais subsistemas associados com o serviço baseado em nuvem 306 que estão falhando, um número dos um ou mais subsistemas que estão falhando, um padrão associado com os um ou mais subsistemas que estão falhando, entre outros. Os critérios podem estar incluídos na falha 312. A falha 312 pode ser mapeada para a ação de recuperação 316 com base nos critérios.

[042] A Figura 4 ilustra características de relatório de um esquema para recuperar um serviço baseado em nuvem com base em uma experiência de cliente, de acordo com modalidades.

[043] Em um diagrama 400, um aplicativo de gerenciamento 410 pode gerar um relatório 420 com base em uma simulação de uma experiência de cliente em um serviço baseado em nuvem para determinar uma ou mais falhas no serviço baseado em nuvem. O relatório 420 pode incluir as informações associadas com uma falha 412, uma ação de recuperação 416, ou um status de sucesso 418. O relatório 420 pode ser formatado para coincidir com um formato de relatório como solicitado por uma parte interessada 422.

[044] A parte interessada 422 pode incluir um cliente associado com a experiência de cliente. A parte interessada 422 pode também incluir um administrador do sistema baseado em nuvem. O relatório 420 pode ser transmitido com base em uma programação. Alternativamente, o relatório 420 pode ser transmitido dinamicamente com base em uma conclusão de uma simulação da experiência de usuário e resolução da falha 412.

[045] O efeito técnico de recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema pode incluir melhoramentos em restauração de um serviço baseado em nuvem quando condições de falha com um ou mais subsistemas do serviço são detectadas.

[046] Os cenários e esquemas exemplares nas Figuras 2 e 4 estão mostrados com componentes, tipos de dados, e configurações específicos. As modalidades não estão limitadas a sistemas de acordo com estas configurações exemplares. A recuperação de operacionalidade de um serviço baseado em nuvem de uma falha de sistema pode ser implementada em configurações que empregam menos ou adicionais componentes em aplicações e interfaces de usuário. Mais ainda, o esquema e componentes exemplares mostrados nas Figuras 2 e 4 e seus subcomponentes podem ser implementados em um modo similar com outros valores utilizando os princípios aqui descritos.

[047] A Figura 5 é um ambiente em rede exemplar, onde modalidades podem ser implementadas. Um aplicativo de gerenciamento configurado para prover uma recuperação baseada em cliente de um serviço baseado em nuvem pode ser implementado através de um software executado sobre um ou mais servidores 514 tal como um serviço hospedado. A plataforma pode comunicar com as aplicações de cliente em dispositivos de computação individuais tal como um smartphone 513, um computador laptop 512, ou computador desktop 511 ('dispositivos de cliente') através de rede(s) 510.

[048] As aplicações de cliente executadas em qualquer dos dispositivos de cliente 511-513 podem facilitar as comunicações através de aplicação(ões) executadas por servidores 514, ou em um servidor individual 516. O aplicativo de gerenciamento pode simular uma experiência de cliente para determinar uma ou mais falhas em um serviço baseado em nuvem. A falha pode ser mapeada para uma ação de recuperação a qual pode ser executada e monitorada para determinar um status de sucesso da ação de recuperação. O aplicativo de gerenciamento pode armazenar os dados associados com a falha e a ação de recuperação em armazenamento(s) de dados 519 diretamente ou através de um servidor de banco de dados 518.

[049] A(s) rede(s) 510 pode(m) compreender qualquer topologia de servidores, clientes, provedores de serviço de Internet, e meio de comunicação. Um sistema de acordo com modalidades pode ter uma topologia estática ou dinâmica. A(s) rede(s) 510 podem incluir redes seguras tal como uma rede empresarial, uma rede não segura tal como uma rede aberta sem fio, ou a Internet. A(s) rede(s) 510 podem também coordenar a comunicação sobre outras redes tal como uma Rede Telefônica Pública Comutada (PSTN) ou redes de celular. Mais ainda, a(s) rede(s) 510 podem incluir redes sem fio de curto alcance tal como Bluetooth ou similares. A(s) rede(s) 510 proveem uma comunicação entre os nodos aqui descritos. Como exemplo, e não limitação, a(s) rede(s) 510 podem incluir um meio sem fio tal como um meio acústico, RF, infravermelho e outros meios sem fio.

[050] Muitas outras configurações de dispositivos de computação, aplicações, fontes de dados, e sistemas de distribuição de dados podem ser empregados para recuperar a operacionalidade de um serviço baseado em nuvem de a falha de sistema. Mais ainda, os ambientes em rede discutidos na Figura 5 são para propósitos de ilustração somente. As modalidades não estão limitadas às aplicações, módulos, ou processos exemplares.

[051] A Figura 6 ilustra um dispositivo de computação de uso geral, o qual pode estar configurado para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema, disposto de acordo com pelo menos algumas modalidades aqui descritas.

[052] Por exemplo, o dispositivo de computação 600 pode ser utilizado para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema. Em exemplo de uma configuração básica 602, o dispositivo de computação 600 pode incluir um ou mais processadores 604 e uma memória de sistema 606. Um barramento de memória 608 pode ser utilizado para a comunicação entre o processador 604 e a memória de sistema 606. A configuração básica 602 pode estar ilustrada na FIG. 6 por estes componentes dentro da linha tracejada interna.

[053] Dependendo da configuração desejada, o processador 604 pode ser de qualquer tipo, incluindo, mas não limitado a, um microprocessador (μP), a microcontrolador (μC), a processador de sinal digital (DSP), ou qualquer sua combinação. O processador 604 pode incluir um ou mais níveis de cache, tal como memória cache de nível 612, um núcleo de processador 614, e registros 616. O núcleo de processador 614 pode incluir uma unidade lógica aritmética (ALU), a unidade de ponto flutuante (FPU), um núcleo de processamento de sinal digital (Núcleo DSP), ou qualquer sua combinação. Um controlador de memória 618 pode também ser utilizado com o processador 604, ou em algumas implementações, o controlador de memória 618 pode ser uma parte interna do processador 604.

[054] Dependendo da configuração desejada, a memória de sistema 606 pode ser de qualquer tipo incluindo mas não limitado a memória volátil (tal como RAM), memória não volátil (tal como ROM, memória instantânea, etc.), ou qualquer sua combinação. A memória de sistema 606 pode incluir um sistema de operação 620, um aplicativo de gerenciamento 622, e dados de programa 624. O aplicativo de gerenciamento 622 pode simular uma experiência de cliente para determinar uma ou mais falhas em um serviço baseado em nuvem. O aplicativo de gerenciamento 622 pode mapear a falha a uma ação de recuperação e executar a ação de recuperação para restaurar um subsistema associado com a falha. Os dados de programa 624 podem incluir, entre outros dados, dados de simulação data 628, ou similares, como aqui descritos. Os dados de simulação 628 podem incluir as informações associado com a falha e a ação de recuperação.

[055] O dispositivo de computação 600 pode ter características ou funcionalidades adicionais, e interfaces adicionais para facilitar as comunicações entre a configuração básica 602 e quaisquer dispositivos e interfaces desejados. Por exemplo, um controlado de barramento / interface 630 pode ser utilizado para facilitar as comunicações entre a configuração básica 602 e um ou mais dispositivos de armazenamento de dados 632 através de um barramento de interface de armazenamento 634. Os dispositivos de armazenamento de dados 632 podem ser ou mais dispositivos de armazenamento removíveis 636, um ou mais dispositivos de armazenamento não removíveis 638, ou uma sua combinação. Exemplos dos dispositivos de armazenamento removíveis e armazenamento não removíveis podem incluir dispositivos de disco magnético, tais como unidades de disco flexível e unidades de disco rígido (HDD), unidades de disco ótico tal como unidades de disco compacto (CD) ou unidades de disco versátil digital (DVD) unidades de estado sólido (SSD), e unidades de fita, para mencionar alguns. O meio de armazenamento de computador exemplar pode incluir um meio volátil e não volátil, removível, e não removível implementado em qualquer método ou tecnologia para armazenamento de informações, tal como instruções legíveis por computador, estruturas de dados, módulos de programa, ou outros dados.

[056] A memória de sistema 606, os dispositivos de armazenamento removíveis 636, e os dispositivos de armazenamento não removíveis 638 podem ser exemplos de meio de armazenamento de computador. O meio de armazenamento de computador pode incluir, mas pode não estar limitado a, RAM, ROM, EEPROM, memória instantânea ou outra tecnologia de memória, CD-ROM, discos versáteis digitais (DVD), unidades de estado sólido, ou outro armazenamento ótico, cassetes magnéticos, fita magnética, armazenamento de disco magnético ou outros dispositivos de armazenamento magnético, ou qualquer outro meio o qual possa ser utilizado para armazenar as informações desejadas e o qual possa ser acessado pelo dispositivo de computação 600. Qualquer tal meio de armazenamento de computador pode ser parte do dispositivo de computação 600.

[057] O dispositivo de computação 600 pode também incluir um barramento de interface 640 para facilitar a comunicação de vários dispositivos de interface (por exemplo, um ou mais dispositivos de saída 642, uma ou mais interfaces periféricas 644, e um ou mais dispositivos de comunicação 666) com a configuração básica 602 através do controlador de barramento / interface 630. Alguns dos dispositivos de saída exemplares 642 podem incluir uma unidade de processamento gráfico 648 e uma unidade de processamento de áudio 650, as quais podem estar configuradas para comunicar com vários dispositivos externos, tal como um display ou alto-falantes através de uma ou mais portas A/V 652. Uma ou mais interfaces periféricas exemplares 644 podem incluir um controlador de interface serial 654 ou um controlador de interface paralela 656, o qual pode estar configurado para comunicar com dispositivos externos tal como dispositivos de entrada (por exemplo, teclado, mouse, caneta, dispositivo de entrada de voz, dispositivo de entrada de toque, etc.) ou outros dispositivos periféricos (por exemplo, impressora, scanner, etc.) através de uma ou mais portas I/O 658. Um dispositivo de comunicação exemplar 666 pode incluir um controlador de rede 660, o qual pode estar disposto para facilitar as comunicações com um ou mais outros dispositivos de computação 662 sobre uma conexão de comunicação de rede através de uma ou mais portas de comunicação 664. Os um ou mais outros dispositivos de computação 662 podem incluir servidores, equipamento de cliente, e dispositivos comparáveis.

[058] A conexão de comunicação de rede pode ser um exemplo de um meio de comunicação. O meio de comunicação pode estar incorporado por instruções legíveis por computador, estruturas de dados, módulos de programa, ou outros dados em um sinal de dados modulado, tal como uma onda portadora ou outro mecanismo de transporte, e pode incluir qualquer meio de fornecimento de informações. Um "sinal de dados modulado" pode ser um sinal que tem uma ou mais das características de sinal de dados modulado ajustadas ou mudadas de tal modo a codificar as informações no sinal. Como exemplo, e não limitação, o meio de comunicação pode incluir um meio com fio tal como uma rede com fio ou conexão com fio direta, e um meio sem fio tal como acústico, frequência de rádio (RF), microondas, infravermelho (IR), e outros meios sem fio. O termo meio legível por computador, como aqui utilizado, pode incluir tanto um meio de armazenamento quanto um meio de comunicação.

[059] O dispositivo de computação 600 pode ser implementado como uma parte de um servidor de uso geral ou especializado, mainframe, ou um computador similar, o qual inclui qualquer uma das funções acima. O dispositivo de computação 600 pode também ser implementado como um computador pessoal incluindo configurações tanto de computador laptop quanto computador não laptop.

[060] As modalidades exemplares podem também incluir a recuperação de operacionalidade de um serviço baseado em nuvem de uma falha de sistema. Estes métodos podem ser implementados em qualquer número de modos, incluindo as estruturas aqui descritas.Um tal modo pode ser por operações de máquina, utilizando dispositivos do tipo descrito na presente descrição. Outro modo opcional pode ser que um ou mais das operações individuais dos métodos sejam executadas em conjunto com um ou mais operadores humanos executando algumas das operações enquanto que outras operações podem ser executadas por máquinas. Estes operadores humanos não precisam estar colocalizados uns com os outros, mas cada um pode estar com uma máquina que executa uma porção do programa. Em outros exemplos, a interação humana pode ser automatizada tal como por critérios pré-selecionados que podem ser automatizados por máquina.

[061] A Figura 7 ilustra um fluxograma lógico para um processo para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha de sistema, de acordo com modalidades. O processo 700 pode ser implementado em um aplicativo de gerenciamento do serviço baseado em nuvem.

[062] O processo 700 começa com a operação 710, onde uma transação de cliente associada com uma experiência de cliente pode ser simulada. A transação de cliente pode incluir um ou mais comandos para simular a experiência de cliente no serviço baseado em nuvem. Na operação 720, uma falha associada com o serviço baseado em nuvem pode ser detectada de uma saída da transação de cliente. A ação de recuperação associado com a falha pode ser determinada na operação 730. A falha pode ser mapeada para a ação de recuperação com base em uma coincidência em uma lista de ações de recuperação. A seguir, a ação de recuperação pode ser executada na operação 740. Na operação 750, a ação de recuperação pode ser monitorada para determinar um status de sucesso associado com a ação de recuperação.

[063] As operações incluídas no processo 700 são para propósitos de ilustração. Um aplicativo de gerenciamento de acordo com modalidades pode ser implementado por processos similares com menos ou adicionais etapas, assim como em uma diferente ordem de operações utilizando os princípios aqui descritos.

[064] De acordo com alguns exemplos, um método que é executado em um dispositivo de computação para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha pode estar descrito. O método pode incluir simular uma transação de cliente associada com a experiência de cliente, detectar uma falha associada com o serviço baseado em nuvem de uma saída da transação de cliente, determinar uma ação de recuperação associada com a falha, executar a ação de recuperação, e monitorar a ação de recuperação para determinar um status de sucesso associado com a ação de recuperação.

[065] De acordo com outros exemplos, a experiência de cliente pode ser selecionada de um conjunto de experiências de cliente associadas com um monitoramento de saúde do serviço baseado em nuvem, onde a experiência de cliente é selecionada com base em critérios que incluem pelo menos um de um conjunto de: uma frequência de utilização, uma distribuição de utilização histórica, e uma quão recente utilização. Uma seleção da experiência de cliente de um conjunto de experiências de cliente associadas com um monitoramento de saúde do serviço baseado em nuvem pode ser recebida, onde a seleção pode ser feita por uma parte interessada que inclui um de um conjunto de um cliente associado com a experiência de cliente e um administrador do serviço baseado em nuvem. A experiência de cliente pode ser determinada para armazenar a transação de cliente juntamente com uma ou mais outras transações de cliente. As uma ou mais outras transações de cliente podem ser simuladas para detectar a falha ou uma ou mais outras falhas associadas com o serviço baseado em nuvem.

[066] De acordo com exemplos adicionais, o método pode ainda incluir mapear a falha para um subsistema associado com o serviço baseado em nuvem e executar a ação de recuperação sobre o subsistema para restaurar o subsistema para um status saudável. O método pode ainda incluir mapear a falha para um subsistema falhado associado com o serviço baseado em nuvem e executar a ação de recuperação para rotear novamente um ou mais processos associados com o subsistema falhado para um subsistema saudável que provê uma funcionalidade de transferência automática por falha. Uma ou mais métricas associadas com a experiência de cliente podem ser rastreadas enquanto monitorando a ação de recuperação para determinar que as uma ou mais métricas estejam acima de um ou mais limites associados com o status de sucesso. A falha pode ser casada com a ação de recuperação de uma lista de ações de recuperação.

[067] De acordo com outros exemplos, o método pode ainda incluir em resposta a uma determinação que o status de sucesso é negativo, determinar outra ação de recuperação que está associada com a falha e executar a outra ação de recuperação. A outra ação de recuperação pode ser monitorada para determinar o status de sucesso associado com a outra ação de recuperação. A falha pode ser gerada da saída analisando a saída para diferenciar um ou mais subsistemas falhados associados com o serviço baseado em nuvem.

[068] De acordo com alguns exemplos, um dispositivo de computação para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha pode ser descrito. O dispositivo de computação pode incluir uma memória, um processador acoplado na memória. O processador pode estar configurado para executar um aplicativo de gerenciamento em conjunto com instruções armazenadas na memória. O aplicativo de gerenciamento pode estar configurado para simular uma transação de cliente associada com a experiência de cliente, onde a experiência de cliente armazena a transação de cliente, detectar uma falha associada com o serviço baseado em nuvem de uma saída da transação de cliente, determinar uma ação de recuperação associado com a falha, executar a ação de recuperação, e monitorar a ação de recuperação para determinar um status de sucesso associado com a ação de recuperação.

[069] De acordo com outros exemplos, o aplicativo de gerenciamento está ainda configurado para gerar um relatório que inclui informações associadas com a falha e transmitir o relatório para uma parte interessada associada com o sistema baseado em nuvem, onde a parte interessada inclui um cliente associado com a experiência de cliente e um administrador do sistema baseado em nuvem. O aplicativo de gerenciamento está ainda configurado para gerar um relatório que inclui informações associadas com a ação de recuperação e o status de sucesso e transmitir o relatório para uma parte interessada associada com o sistema baseado em nuvem, onde a parte interessada inclui um cliente associado com a experiência de cliente e um administrador do sistema baseado em nuvem.

[070] De acordo com alguns exemplos, o aplicativo de gerenciamento está ainda configurado para analisar a saída para determinar um ou mais critérios que incluem pelo menos um de um conjunto de: um ou mais subsistemas associados com o serviço baseado em nuvem que estão falhando, um número dos um ou mais subsistemas que estão falhando, e um padrão associado com os um ou mais subsistemas que estão falhando. Os um ou mais critérios podem estar incluídos na falha e a falha pode ser mapeada para a ação de recuperação com base nos critérios. Um número de disponibilidade pode ser gerado de métricas associadas com um ou mais subsistemas do serviço baseado em nuvem dentro da saída. A falha pode ser determinada em resposta a uma determinação que o número de disponibilidade é menor do que um limite, onde o limite é configurável por um administrador do serviço baseado em nuvem.

[071] De acordo com alguns exemplos, um dispositivo de memória legível por computador com instruções armazenadas no mesmo para recuperar a operacionalidade de um serviço baseado em nuvem de uma falha pode estar descrito. As instruções podem incluir ações que são similares ao método acima descrito.

[072] O relatório descritivo acima, exemplos e dados proveem uma completa descrição da fabricação e utilização da composição das modalidades. Apesar do assunto ter sido descrito em uma linguagem específica a características estruturais e/ou atos metodológicos, deve ser compreendido que o assunto definido nas reivindicações anexas não está necessariamente limitado às características ou atos específicos acima descritos. Ao invés, as características e atos específicos acima descritos estão descritos como formas exemplares de implementar as reivindicações e modalidades.

Claims

1. Método executado em um dispositivo de computação para recuperar a operacionalidade de um serviço baseado em nuvem a partir de uma falha, o método caracterizado pelo fato de que compreende as etapas de: selecionar uma experiência de cliente a partir de um conjunto de experiências de cliente associadas com um monitoramento de integridade do serviço baseado em nuvem, em que a experiência de cliente é selecionada com base em um critério que inclui pelo menos um dentre um conjunto de; uma frequência de uso, uma distribuição de uso histórica, e um uso recente; simular uma transação de cliente associada com a experiência de cliente; detectar a falha associada com o serviço baseado em nuvem de uma saída da transação de cliente; determinar uma ação de recuperação associada com a falha; executar a ação de recuperação; e monitorar a ação de recuperação para determinar um status de sucesso associado com a ação de recuperação.

2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: receber uma seleção da experiência de cliente de um conjunto de experiências de cliente associadas com um monitoramento de integridade do serviço baseado em nuvem, em que a seleção é feita por uma parte interessada incluindo um dentre um conjunto de um cliente associado com a experiência de cliente e um administrador do serviço baseado em nuvem.

3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: determinar a experiência de cliente armazenando a transação de cliente juntamente com uma ou mais outras transações de cliente; e simular a uma ou mais outras transações de cliente para detectar a falha ou uma ou mais outras falhas associadas ao serviço baseado em nuvem.

4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: mapear a falha para um subsistema associado ao serviço baseado em nuvem; e executar a ação de recuperação no subsistema para restaurar o subsistema para um status íntegro.

5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: mapear a falha para um subsistema falhado associado ao serviço baseado em nuvem; e executar a ação de recuperação para rotear novamente um ou mais processos associados ao subsistema falhado para um subsistema íntegro que proporciona funcionalidade de recuperação de falha.

6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: rastrear uma ou mais métricas associadas com a experiência de cliente enquanto monitorando a ação de recuperação para determinar que a uma ou mais métricas estão acima de um ou mais limites associados com o status de sucesso.

7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: coincidir a falha com a ação de recuperação de uma lista de ações de recuperação.

8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: em resposta a uma determinação de que o status de sucesso é negativo, determinar outra ação de recuperação que é associada com a falha; e executar a outra ação de recuperação.

9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que ainda compreende: monitorar a outra ação de recuperação para determinar o status de sucesso associado com a outra ação de recuperação.

10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende: gerar a falha da saída analisando a saída para diferenciar um ou mais subsistemas falhados associados com o serviço baseado em nuvem.

11. Dispositivo de computação para recuperar a operacionalidade de um serviço baseado em nuvem a partir de uma falha, o dispositivo de computação compreendendo: uma memória; um processador acoplado na memória, o processador executando um conjunto de instruções armazenadas na memória, caracterizado pelo fato de que o conjunto de instruções é configurado para: selecionar uma experiência de cliente a partir de um conjunto de experiências de cliente associadas com um monitoramento de integridade do serviço baseado em nuvem, em que a experiência de cliente é selecionada com base em um critério que inclui pelo menos um dentre um conjunto de; uma frequência de uso, uma distribuição de uso histórica, e um uso recente; simular uma transação de cliente associada com a experiência de cliente, em que a experiência de cliente armazena a transação de cliente; detectar a falha associada com o serviço baseado em nuvem de uma saída da transação de cliente; determinar uma ação de recuperação associada com a falha; executar a ação de recuperação; e monitorar a ação de recuperação para determinar um status de sucesso associado com a ação de recuperação.

12. Dispositivo de computação, de acordo com a reivindicação 11, caracterizado pelo fato de que o aplicativo de gerenciamento é ainda configurado para: gerar um relatório que inclui informações associadas com a falha; e transmitir o relatório para uma parte interessada associada com o sistema baseado em nuvem, em que a parte interessada inclui um cliente associado com a experiência de cliente e um administrador do sistema baseado em nuvem.

13. Dispositivo de computação, de acordo com a reivindicação 11, caracterizado pelo fato de que o aplicativo de gerenciamento é ainda configurado para: gerar um relatório que inclui informações associadas com ação de recuperação e o status de sucesso; e transmitir o relatório para uma parte interessada associada com o sistema baseado em nuvem, em que a parte interessada inclui um cliente associado com a experiência de cliente e um administrador do sistema baseado em nuvem.

14. Dispositivo de computação, de acordo com a reivindicação 11, caracterizado pelo fato de que o aplicativo de gerenciamento é ainda configurado para: analisar a saída para determinar um ou mais critérios que incluem pelo menos um dentre um conjunto de: informações de identificação de um ou mais subsistemas associados com o serviço baseado em nuvem que estão falhando, um número do um ou mais subsistemas que estão falhando, e um padrão associado com o um ou mais subsistemas que estão falhando.

15. Dispositivo de computação, de acordo com a reivindicação 14, caracterizado pelo fato de que o aplicativo de gerenciamento é ainda configurado para: incluir o um ou mais critérios na falha; e mapear a falha para a ação de recuperação com base nos critérios.

16. Dispositivo de computação, de acordo com a reivindicação 11, caracterizado pelo fato de que o aplicativo de gerenciamento é ainda configurado para: gerar um número de disponibilidade a partir de métricas associadas com um ou mais subsistemas do serviço baseado em nuvem dentro da saída; determinar a falha em resposta a uma determinação de que o número de disponibilidade é menor do que um limite, em que o limite é configurável por um administrador do serviço baseado em nuvem.

17. Dispositivo de memória legível por computador que possui instruções armazenadas no mesmo para recuperar operacionalidade de um serviço baseado em nuvem a partir de uma falha, caracterizado pelo fato de que as instruções compreendem: selecionar uma experiência de cliente a partir de um conjunto de experiências de cliente associadas com um monitoramento de integridade do serviço baseado em nuvem, em que a experiência de cliente é selecionada com base em um critério que inclui pelo menos um dentre um conjunto de; uma frequência de uso, uma distribuição de uso histórica, e um uso recente; simular uma transação de cliente associada com a experiência de cliente, em que a experiência de cliente armazena a transação de cliente; detectar a falha associada com o serviço baseado em nuvem a partir de uma saída da transação de cliente; determinar uma ação de recuperação associada com a falha; executar a ação de recuperação; monitorar a ação de recuperação para determinar um status de sucesso associado com a ação de recuperação; gerar um relatório que inclui informações associadas com a falha, a ação de recuperação, e o status de sucesso; transmitir o relatório para uma parte interessada associada com o sistema baseado em nuvem, em que a parte interessada inclui um cliente associado com a experiência de cliente e um administrador do sistema baseado em nuvem; e rastrear uma ou mais métricas associadas com a experiência de cliente enquanto monitorando a ação de recuperação para determinar que a uma ou mais métricas estão acima de um ou mais limites associados com o status de sucesso.

18. Dispositivo de memória legível por computador, de acordo com a reivindicação 17, caracterizado pelo fato de que as instruções ainda compreendem: em resposta a uma determinação de que o status de sucesso é negativo, determinar outra ação de recuperação que é associada com a falha; executar a outra ação de recuperação; e monitorar a outra ação de recuperação para determinar o status de sucesso associado com a outra ação de recuperação.

19. Dispositivo de memória legível por computador, de acordo com a reivindicação 17, caracterizado pelo fato de que as instruções ainda compreendem: analisar a saída para determinar um ou mais critérios que incluem pelo menos um dentre um conjunto de: informações de identificação de um ou mais subsistemas associados com o serviço baseado em nuvem que estão falhando, um número do um ou mais subsistemas que estão falhando, e um padrão associado com o um ou mais subsistemas que estão falhando; incluir o um ou mais critérios na falha; e mapear a falha para a ação de recuperação com base nos critérios.