Calculadora de Downtime

Informe a disponibilidade contratada (o SLA) e veja quanto tempo de parada ela permite em cada período. A conta é parada = período × (1 - disponibilidade).

Entenda o downtime por SLA

O SLA (Service Level Agreement) é o acordo de nível de serviço, o percentual de tempo em que um fornecedor se compromete a manter o serviço no ar. Esta calculadora traduz esse percentual em tempo de parada tolerado, o chamado error budget, para cada período. Todo o cálculo acontece no seu navegador e nenhum dado é enviado para servidores.

Conceitos

SLA (disponibilidade alvo): O percentual de disponibilidade que se pretende garantir. Um SLA de 99,9% admite que o serviço fique fora no máximo 0,1% do tempo.
Uptime: A fração do tempo em que o sistema está no ar, expressa em percentual.
Downtime: O tempo em que o sistema fica indisponível. É o complemento do uptime: equivale a 100% menos o uptime.
Error budget (orçamento de erro): A parada máxima que se pode gastar num período sem furar o SLA. É justamente o resultado desta aba.
Noves: Forma curta de citar a disponibilidade pela quantidade de noves. 99,9% são "três noves" e 99,99% são "quatro noves". Cada nove a mais divide a parada tolerada por dez.

Como a conta funciona

A parada tolerada é o período multiplicado pela indisponibilidade, que vale 100% menos o SLA. Num mês de cerca de 2.629.800 segundos com SLA de 99,9%, a indisponibilidade é 0,1%, então a parada vale 2.629.800 × 0,001, aproximadamente 43 minutos. O mês usa o ano dividido por 12 (365,25 dias), padrão das calculadoras de SLA. Use os presets para preencher os tiers de SLA mais comuns; o resultado mostra a parada tolerada em cada período, do dia ao ano.

Informe o tempo de parada que sua operação aguenta num período e descubra a disponibilidade (SLA) necessária. A conta é disponibilidade = (1 - parada / período) × 100.

Entenda o SLA a partir do downtime

Aqui o caminho é inverso. Em vez de partir do SLA, você informa quanto tempo de parada a operação suporta num período e descobre a disponibilidade mínima que entrega essa folga. É útil para definir metas internas ou negociar contratos a partir da tolerância real do negócio.

Conceitos

Parada tolerada: O tempo de indisponibilidade que a operação suporta dentro do período sem prejuízo relevante.
Período: A janela em que essa parada pode ocorrer (dia, semana, mês, trimestre ou ano).
SLA necessário: A disponibilidade mínima que entrega aquela tolerância de parada. Quanto menor a parada aceita, mais alto o SLA exigido.

Como a conta funciona

A disponibilidade é (1 - parada / período) × 100. Tolerar 1 hora de parada por mês dá (1 - 3.600 / 2.629.800) × 100, cerca de 99,86%. Você escolhe a unidade da parada (minutos ou horas) e o período de referência; a parada informada não pode ser maior que o próprio período. Vale lembrar que cada nove a mais na disponibilidade costuma custar caro em infraestrutura, então definir a tolerância real evita pagar por um SLA que o negócio não precisa.

Disponibilidade é a fração do tempo em que o sistema fica no ar. A conta usa o tempo médio entre falhas (MTBF) e o tempo médio de reparo (MTTR): A = MTBF / (MTBF + MTTR).

Entenda a disponibilidade por MTBF e MTTR

A disponibilidade de um equipamento ou sistema pode ser estimada a partir de duas métricas de confiabilidade: o tempo médio entre falhas (MTBF) e o tempo médio de reparo (MTTR). Quanto mais o sistema funciona entre falhas e quanto mais rápido o reparo, maior a disponibilidade.

Conceitos

MTBF (Mean Time Between Failures): O tempo médio entre falhas, isto é, quanto o sistema costuma funcionar antes de quebrar.
MTTR (Mean Time To Repair): O tempo médio de reparo, quanto leva para voltar ao ar depois de uma falha.
Disponibilidade: A fração do tempo no ar resultante das duas métricas, expressa em percentual.

Como a conta funciona

A disponibilidade é A = MTBF / (MTBF + MTTR). Com MTBF de 8.760 horas (um ano) e MTTR de 4 horas, A vale 8.760 / 8.764, cerca de 99,95%. MTBF e MTTR precisam estar na mesma unidade. A calculadora aceita unidades diferentes em cada campo (de minutos a anos) e converte os dois antes da conta, então você pode informar, por exemplo, MTBF em meses e MTTR em horas.

Combine a disponibilidade de vários componentes. Em série, todos precisam funcionar e a disponibilidade cai. Em paralelo (redundância), basta um funcionar e a disponibilidade sobe.

Entenda a disponibilidade em série e em paralelo

Sistemas reais são feitos de vários componentes, e a disponibilidade do conjunto depende de como eles se combinam. Em série, todos precisam funcionar. Em paralelo, ou redundância, basta um funcionar. A diferença entre as duas montagens é o que sustenta clusters e arquiteturas de alta disponibilidade.

Conceitos

Disponibilidade do componente: O percentual de tempo no ar de cada parte do sistema, considerada de forma isolada.
Série: Arranjo em que todos os componentes precisam funcionar. Cada item somado derruba a disponibilidade do conjunto.
Paralelo (redundância): Arranjo em que basta um componente funcionar. A redundância aumenta a disponibilidade e é a base de clusters e alta disponibilidade.

Como a conta funciona

Em série, multiplique as disponibilidades. Três componentes de 99% dão 0,99 × 0,99 × 0,99, cerca de 97,03%, sempre menos que o pior componente isolado. Em paralelo, multiplique as indisponibilidades e subtraia de 1. Dois componentes de 99% em redundância dão 1 - 0,01 × 0,01, ou seja, 99,99%. Por isso a redundância é a forma mais direta de ganhar noves.

Como usar a calculadora

Adicione quantos componentes quiser, dê um nome a cada um e arraste pela alça para reordená-los. A ordem não muda o resultado, já que a multiplicação é comutativa: serve apenas para organizar a lista. O cálculo considera todos os componentes no mesmo arranjo, ou seja, todos em série ou todos em paralelo. Para uma topologia mista (por exemplo, dois nós redundantes, cada um com vários componentes em série), calcule cada bloco separadamente e use o resultado de um como entrada do outro.

Aviso: os valores são estimativas de referência, não cálculos de perdas reais ou medidas. Não constituem compromisso de SLA, promessa nem garantia de indenização ou ressarcimento por parte da Power X.

Estime quanto faturamento o negócio deixa de realizar durante uma parada. É o valor que a alta disponibilidade ajuda a evitar. A conta é perda = (faturamento / período) × parada × fração dependente.

Entenda o impacto financeiro de uma parada

Toda hora de indisponibilidade tem um custo de oportunidade: o faturamento que o negócio deixa de realizar enquanto o sistema está fora. Esta estimativa ajuda a dimensionar o valor que a alta disponibilidade evita. É um número de referência, não um compromisso de SLA nem uma garantia de indenização.

Conceitos

Faturamento de referência: A receita do negócio no período escolhido (dia, semana, mês ou ano).
Período: A janela a que esse faturamento se refere, usada para achar a receita por unidade de tempo.
Fração dependente do sistema: A parte do faturamento que de fato para quando o sistema cai. Use 100% se toda a operação depende dele.
Parada: A duração da indisponibilidade considerada na estimativa.

Como a conta funciona

Divida o faturamento pelo período para achar a receita por segundo e multiplique pela duração da parada e pela fração que depende do sistema. Um faturamento de R$ 100.000 por mês equivale a 100.000 / 2.629.800 por segundo, então 4 horas de parada representam cerca de R$ 548 em faturamento não realizado. Ajuste a fração quando só parte da operação depende do sistema que ficou fora. Além da perda na parada informada, o resultado mostra o valor equivalente por hora e por dia, úteis para comparar cenários.

Estime o impacto financeiro de uma parada para um provedor. Preencha a base e ative só os componentes que fazem sentido no seu caso: o total soma os selecionados. São estimativas de referência do que a alta disponibilidade ajuda a evitar.

Entenda o impacto de uma parada para um provedor

Para um provedor de internet, o prejuízo de uma parada vai além das horas sem faturar. Ele aparece em cancelamentos, em créditos obrigatórios na fatura, em multas de contratos corporativos e no custo de atender a enxurrada de chamados. Esta calculadora soma os componentes que você ativar. Todos são estimativas de referência do que a alta disponibilidade ajuda a evitar, não compromissos de SLA.

Conceitos

Assinantes afetados: A base de clientes impactada pela parada.
ARPU (Average Revenue Per User): A receita média por assinante por mês. É a base para estimar o faturamento exposto durante a indisponibilidade.
Cancelamentos (churn): Os assinantes que cancelam após a instabilidade. Cada cancelamento leva embora vários meses de receita recorrente.
Reembolso por interrupção (RGC / Anatel): O crédito proporcional ao tempo sem serviço que o provedor devolve na fatura, conforme o Regulamento Geral de Direitos do Consumidor.
Multa de SLA corporativo: O crédito contratual em links dedicados a empresas: um percentual da mensalidade por hora fora do SLA.
Custo de atendimento: A despesa extra com o pico de chamados que a parada gera no call center.

Como cada componente é calculado

Cancelamentos: assinantes afetados × % que cancela × ARPU × meses de permanência perdidos. Costuma ser o componente mais pesado, porque cada saída representa meses de receita que deixam de entrar.
Reembolso por interrupção: crédito proporcional, assinantes × ARPU / mês × parada. A regulação da Anatel obriga o provedor a devolver na fatura o valor proporcional ao tempo sem serviço.
Multa de SLA corporativo: clientes corporativos × preço médio do link × % de multa por hora fora do SLA, limitada à própria mensalidade dos links.
Custo de atendimento: assinantes que abrem chamado × custo por atendimento. Mede a despesa operacional do pico de suporte durante o incidente.

Calculadora de Downtime

Entenda o downtime por SLA

Conceitos

Como a conta funciona

Entenda o SLA a partir do downtime

Conceitos

Como a conta funciona

Entenda a disponibilidade por MTBF e MTTR

Conceitos

Como a conta funciona

Entenda a disponibilidade em série e em paralelo

Conceitos

Como a conta funciona

Como usar a calculadora

Entenda o impacto financeiro de uma parada

Conceitos

Como a conta funciona

Entenda o impacto de uma parada para um provedor

Conceitos

Como cada componente é calculado

Pronto para escalar sua infraestrutura?