Confiabilidade - Series- 1 - Confiabilidade vs resiliência

Por Trusted Cloud Team 

 

Por David Bills, Chefe estrategista de Confiabilidade Trustworthy Computing

Sempre que eu falo para os clientes e parceiros sobre a confiabilidade , sou lembrado que embora os objetivos e as prioridades, no final todos querem que o serviço funcione. Como cliente você quer ser capaz de fazer as coisas online, em um momento conveniente para você. Como uma organização - ou um prestador de serviços - pretende que os seus clientes realizem suas tarefas que eles precisam.

Este artigo é o primeiro artigo em uma série de quatro partes sobre a construção de um serviço de resiliência. Em meus dois primeiros posts, vou discutir o tema no que se refere à estratégia de negócios e, em seguida, vamos mergulhar em detalhes técnicos. A série completa de quatro partes vai cobrir:

1. Confiabilidade vs resiliência - Qual é a diferença entre confiabilidade, resiliência e por que ela é importante? 
2. As ameaças comuns relacionadas com a confiabilidade – DIAL (Descoberta, Incorreção, Autorização e Autenticação, Limites/Latência) é um recurso mnemônico fácil para ajudar que as equipes discutam possíveis falhas das interações entre os componentes de seu serviço de uma forma estruturada. O debate sobre os modos de falha e pontos de falha é uma fase essencial da análise de resistência e modelagem (RMA) e pode ajudar equipes a melhorar a confiabilidade dos seus serviços.
3. Incrementando técnicas de confiabilidade - tendo o "D" e "A" no acrônimo DIAL, vamos analisar algumas técnicas de confiabilidade aprimorando o que você pode incorporar em seu projeto relacionado com a descoberta e a autenticação.
4. Incrementando técnicas de confiabilidade - tendo o "I" e "L" no acrônimo DIAL, vamos analisar algumas técnicas de confiabilidade aprimorando o que você pode incorporar em seu projeto relacionados à incorreção e limites.

A minha intenção é dar uma visão geral de como a Microsoft pensa sobre a confiabilidade dos processos e técnicas que estamos empregando para melhorar a confiabilidade de nossos serviços para os nossos clientes.

Então, o que é a confiabilidade? Quando eu pergunto aos clientes e parceiros, as respostas mais comuns referem-se à coerência no desempenho, velocidade, disponibilidade, e talvez o mais significativo - resistência. Uma coisa em que todos estamos de acordo é que, para um sistema ou serviço ser confiável, o usuário tem de acreditar "que funciona".

O Institute of Electrical and Electronics Engineers (IEEE) Reliability Society afirma que a confiabilidade é um "projeto de engenharia de disciplina que aplica conhecimentos científicos para garantir que um sistema vai realizar a sua função a que destina o tempo necessário dentro de um determinado ambiente, incluindo a capacidade de testar e apoiar o sistema através do seu ciclo de vida total." Para o software, ele define confiança como "a probabilidade de um software sem falha por um determinado período de tempo em um determinado ambiente".

Um serviço confiável de nuvem - "cloud computing" -  é essencialmente um que funcione de acordo como desenho do serviço, quando é esperado, e sempre que o cliente está conectado. Que é para não dizer que todos os componentes devem funcionar perfeitamente 100% do tempo. Este é último ponto a diferenciar entre confiabilidade e resiliência.

Confiabilidade é o resultado que os provedores de serviços em nuvem se esforçam para atingir- é o resultado. Resiliência é a capacidade de um serviço baseado em nuvem (cloud) para suportar certos tipos de falhas e ainda assim manter funcional a partir da perspectiva do cliente. Em outras palavras, a confiança é o resultado e a resiliência é a forma como você atinge o resultado. Um serviço pode ser caracterizado como confiável simplesmente porque faz parte de um serviço que nunca falhou, e ainda assim o serviço não poderia ser considerado como resistente porque esses recursos aumentam a confiabilidade que nunca pôde ter sido antes testado.

Os principais pontos aqui é a importância de centrar-se na resiliência e projetar-se para construir resiliência em seu serviço em todas as fases do ciclo de vida de desenvolvimento de software. Para saber mais sobre os princípios básicos de construção de um serviço confiável online, leia o nosso relatório técnico “An introduction to designing reliable cloud services”.