Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Computação em Nuvem

Interrupção na nuvem:por que e como isso acontece?


Quanto mais a TI depender de serviços em nuvem, maior a probabilidade de você sofrer inatividade e perdas de receita devido a uma interrupção na nuvem. Mais de 60% das organizações que usam a nuvem pública relatam perdas em 2022 devido a esses incidentes, portanto, as interrupções não são uma ocorrência incomum que as empresas dificilmente enfrentarão.

Mas as interrupções são motivo suficiente para deixar a nuvem para sempre? Ou você deve ficar com esse tipo de infraestrutura, apesar do risco de tempo de inatividade ocasional?

Este artigo aborda tudo o que você precisa saber sobre interrupções na nuvem . Descrevemos suas principais causas, examinamos estatísticas surpreendentes, mostramos como minimizar o impacto do tempo de inatividade da nuvem e analisamos as interrupções mais impactantes que ocorreram nos últimos anos.

O que é uma interrupção na nuvem?


Uma interrupção na nuvem é um período de tempo durante o qual os serviços de um provedor de nuvem ficam indisponíveis para os usuários finais. A infraestrutura do fornecedor fica inativa (devido a um bug, falha de energia etc.) e os clientes perdem o acesso aos ativos baseados em nuvem até que o fornecedor corrija o problema.

Em termos de impacto, não há diferença entre a queda de um data center no local e uma interrupção na nuvem. Você perde o acesso aos ativos de TI em ambos os casos, mas a abordagem prática à computação em nuvem adiciona algumas considerações exclusivas:

Assim como no hardware local, existem dois tipos de interrupções possíveis:

Estudos recentes revelam que interrupções não planejadas custam 35% mais do que o tempo de inatividade planejado (tanto no local quanto na nuvem). A diferença de preço existe porque incidentes inesperados levam mais tempo para serem identificados e corrigidos – e quanto mais tempo uma interrupção durar, maior será o dano.

Em comparação com o hardware no local, a infraestrutura baseada em nuvem resulta em tempo de inatividade mais frequente, mas com menos gravidade . Como nenhum sistema de hospedagem oferece 100% de tempo de atividade, os clientes estão prontos para tolerar interrupções ocasionais em troca das vantagens da computação em nuvem. Essa disposição também é evidente no crescimento do mercado – a nuvem representará 14,2% do total global de gastos com TI em 2024 (acima dos 9,1% em 2020).

Causas de interrupção na nuvem


As interrupções na nuvem resultam de várias causas dentro e fora do controle do provedor. Segue uma lista dos mais comuns:

O que acontece quando a nuvem cai?


Na melhor das hipóteses, uma interrupção na nuvem dura apenas alguns minutos e afeta um pequeno número de usuários ou serviços. Na pior das hipóteses, uma interrupção paralisa os negócios de um cliente por meio dia ou mais. Uma empresa perde o acesso a todos os ativos baseados em nuvem e permanece cortada até que a interrupção termine.

Embora ameaçador, erros de provedores terceirizados foram a causa de "apenas" 7% das interrupções graves em 2021 . Uma interrupção grave deve envolver um (ou vários) dos seguintes:

Embora existam preocupações mais urgentes (como mostrado no gráfico de rosca abaixo), lembre-se de que um minuto médio de inatividade custa US$ 5.600 (este valor por minuto vai para US$ 9.000 para empresas). Se você não estiver preparado (ou seja, não tiver backups de dados, recuperação de desastres etc.), uma interrupção na nuvem poderá interromper seu serviço e causar grandes impactos nos resultados.

Uma empresa que mantém um pequeno segmento de operações na nuvem é menos vulnerável a interrupções. Por exemplo, se você hospedar apenas e-mails na nuvem, mesmo uma interrupção de um dia inteiro não será catastrófica. Você pode aguardar o incidente ou executar aplicativos com funcionalidade reduzida, estratégia que não funciona se você usar a nuvem para executar uma plataforma IoT ou realizar o processamento de pagamentos.

Em alguns casos, a interrupção da nuvem leva à perda permanente de dados (a quantidade de dados perdidos depende da frequência dos backups). Além disso, clientes em setores estritos são responsáveis ​​por multas legais se uma interrupção levar a uma violação ou vazamento de dados, portanto, tenha cuidado ao decidir o que manter no armazenamento em nuvem.

O que os usuários podem fazer?


Veja o que as empresas fazem para mitigar o impacto das interrupções na nuvem:

Maiores interrupções recentes na nuvem


As interrupções na nuvem são inevitáveis ​​ao usar a nuvem, e mesmo os provedores mais populares (como Azure, AWS e Google Cloud) não estão imunes ao tempo de inatividade. Vejamos algumas das interrupções de nuvem mais significativas da história recente.

Interrupção do Azure (outubro de 2021)


Em outubro de 2021, o Microsoft Azure sofreu uma interrupção que desativou os serviços de máquina virtual por seis horas . Durante a interrupção, muitos usuários não conseguiram implantar novas VMs ou atualizar extensões. As operações básicas de gerenciamento de serviços (como iniciar, criar e excluir) também levaram a erros.

A causa da interrupção da nuvem foi a incapacidade das consultas de VM para recuperar os dados de versão necessários de um artefato. Um relatório pós-recuperação revelou que o erro baseado em software ocorreu quando a Microsoft migrou uma de suas arquiteturas de VM.

Interrupção do Google Cloud (novembro de 2021)


O Google Cloud ficou inativo por cerca de duas horas em meados de novembro do ano passado, afetando os gostos de:

Os sites afetados exibiram erros 404 quando os visitantes tentaram acessá-los. O Google informou que a causa da interrupção da nuvem foi uma falha em uma configuração de rede responsável pelo balanceamento de carga.

Interrupção da AWS (dezembro de 2021)


Uma grande atividade de conexão sobrecarrega os dispositivos de rede em uma das principais instalações da AWS, afetando vários sites e aplicativos. Algumas das "vítimas" mais notáveis ​​foram:

O problema do data center causou latência severa nas redes internas da AWS. Os aplicativos dos clientes sentiram os efeitos em cascata, sofrendo atrasos no tráfego ou desligamentos totais por cerca de sete horas .

Duas interrupções subsequentes da IBM (janeiro de 2022)


Um problema com a infraestrutura da IBM afetou os serviços de nuvem na região de Dallas por mais de cinco horas . A equipe interna resolveu o problema, mas acidentalmente causou um problema adicional de uma hora com a nuvem privada virtual. O problema secundário afetou usuários em todo o mundo, incluindo EUA, Japão, Canadá e Alemanha.

Interrupção do AWS/Slack (fevereiro de 2022)


O Slack sofreu uma interrupção de seus recursos de nuvem AWS em fevereiro, o que impediu o uso normal da plataforma de comunicação por cinco horas . Mais de 11.000 usuários relatados não conseguiram:

A equipe do Slack nunca compartilhou o motivo por trás da interrupção da nuvem e solicitou que todos os usuários afetados reiniciem o aplicativo e limpem o cache após a recuperação.

Interrupção do iCloud (março de 2022)


Quinze grandes serviços da Apple ficaram inativos por quatro horas em março devido a uma interrupção na nuvem, incluindo:

Os sistemas corporativos e de varejo da Apple também caíram. Mais tarde, a empresa revelou que a causa raiz era um problema relacionado ao sistema de nomes de domínio (DNS) da empresa.

Interrupção do Google Cloud (março de 2022)


Em 8 de março de 2022, os usuários do Google Cloud sofreram erros de serviço por duas horas e meia . Spotify e Discord estavam entre os atingidos pela interrupção.

Uma alteração no código do Traffic Director para processar as configurações causou o erro. De acordo com o relatório pós-recuperação, as alterações de código incorretas negligenciaram as migrações de formato de dados de configuração, de modo que a plataforma excluiu inadvertidamente a programação do usuário.

Interrupção da Atlassian (abril de 2022)


A maior interrupção da Atlassian do ano começou em 5 de abril e terminou em 18 de abril (embora alguns usuários tenham começado a restaurar os serviços em 8 de abril). A empresa explicou que a interrupção ocorreu devido à comunicação inadequada da equipe e um plano de resposta a incidentes mal planejado.

Embora essa interrupção na nuvem tenha durado quase duas semanas para alguns usuários, não houve relatos de perdas significativas de dados de clientes. No entanto, os usuários dos principais produtos da Atlassian, Trello e Jira, foram afetados pelo problema.

Interrupção do Microsoft Azure (junho de 2022)


Em 7 de junho, os clientes do Azure não puderam se conectar a recursos hospedados na região Leste dos EUA 2 (principalmente Virgínia). A interrupção durou cerca de doze horas e não afetou os consumidores que dependem de infraestrutura com redundância de zona. Os serviços comprometidos incluem:

O culpado foi uma oscilação repentina de energia em um dos data centers locais, que causou o desligamento das Unidades de Tratamento de Ar (AHUs).

Interrupção do Cloudflare (junho de 2022)


Em junho, uma interrupção acidental na Cloudflare causou grandes interrupções que duraram uma hora e meia , derrubando sites populares como:

O fornecedor com sede em São Francisco explicou que o tempo de inatividade não planejado resultou de uma alteração na configuração da rede em 19 de seus data centers.

Não negligencie o valor do planejamento de interrupções na nuvem


Exemplos de interrupções na nuvem nos últimos anos enviam uma mensagem clara:mesmo que a nuvem seja um divisor de águas de TI, a tecnologia não é infalível . As empresas que se preocupam com os usuários finais e a disponibilidade de aplicativos devem estar prontas para um tempo de inatividade ocasional, o que torna o backup e a recuperação de desastres (BDR) parte integrante do uso de recursos baseados em nuvem.

Computação em Nuvem

  1. O que é moldagem por transferência e como ela funciona?
  2. Como (e por que) comparar o desempenho de sua nuvem pública
  3. O que é segurança em nuvem e por que é necessária?
  4. Nuvem e como ela está mudando o mundo da TI
  5. Arquiteturas baseadas em agente vs sem agente:Por que isso é importante?
  6. O que é um servidor VPN ofuscado e como funciona
  7. Como funciona o Google Cloud Storage?
  8. Por que e como realizar uma auditoria de vácuo
  9. O que é uma embreagem industrial e como ela funciona?
  10. Inspeções de guindastes:quando, por que e como?