fbpx
Veja como é feito o cálculo d MTBF (com fórmula e exemplos)

Veja como é feito o cálculo do MTBF (com fórmula e exemplos)

O que não pode ser medido, não pode ser gerenciado. Por isso, um bom gestor de TI deve ter sempre em mãos as métricas e indicadores que ajudem na identificação de gargalos produtivos, indisponibilidade e qualidade dos ativos de TI. Um desses indicadores é o MTBF, que permite a avaliação do tempo médio em que uma máquina fica ativa, antes de apresentar uma nova falha.

Neste post, vamos entender como calcular o MTBF, sua importância para o monitoramento da disponibilidade da infraestrutura de TI e como relacioná-lo com outro importante indicador, o MTTR. Confira!

O que é MTBF?

O MTBF — Mean Time Between Failures, ou Tempo Médio Entre Danos, em português — é um indicador criado para medir o tempo previsto entre falhas de um ativo de TI durante a sua operação.

Nesse sentido, o gestor de TI estipula um período de tempo, verifica quantas paradas ocorreram nesse período e faz o cálculo para saber o tempo médio em que o ativo se mantém produtivo antes de voltar a apresentar um novo problema, que gera uma paralisação.

A expectativa de que a falha ocorrerá em algum ponto é uma parte essencial do MTBF, porém o indicador só leva em consideração as paralisações causadas por falhas operacionais, e não as realizadas de maneira planejada, como, por exemplo, as manutenções preventivas. 

Como é feito o cálculo do MTBF?

O MTBF é calculado utilizando a soma do tempo em que a máquina se manteve operacional dividido pelo número de falhas. Vamos supor que um servidor que precisa funcionar de forma ininterrupta, 24 horas, teve 3 paradas durante o expediente. Uma parada foi de 2 horas, outra foi de 3 horas e a terceira foi de 30 minutos. Nesse cenário, o cálculo do MTBF deverá ser:

  • Tempo em que o servidor deveria ter ficado ativo: 24 horas.
  • Períodos em que o servidor ficou parado: 3 horas, 2 horas e 30 minutos (0,5 horas).
  • Quantidade de paralisações: 3.
  • MTBF = (tempo de atividade esperada – tempo total de paradas) / quantidade de paralisações. 
  • Calcule o tempo em que o servidor se manteve operacional: 24 – 3 – 2 – 0,5 = 18,5 h.
  • Com isso, o cálculo do MTBF será: 18,5/3 = 6,16 h.

O tempo médio entre paradas desse servidor é de 6,16 horas, um MTBF baixo, que pode indicar um problema grave nesse equipamento e que certamente está prejudicando a produtividade dessa empresa.

Mas há outros fatores que tendem a influenciar esse cálculo, sendo um dos principais a interação humana. Um MTBF baixo pode sinalizar, por exemplo, que há uma lentidão no suporte ou até mesmo um trabalho de reparo mal-executado. Ou seja, não dá para diagnosticar as causas do baixo índice apenas por uma variável, julgando sempre como um simples problema com fornecedores ou qualidade dos fabricantes.

Por que o MTBF é tão importante?

O MTBF é um indicador que serve para que os gestores definam o desempenho esperado de um equipamento. Portanto, os fabricantes o utilizam como uma métrica de confiabilidade quantificável e como uma ferramenta essencial durante os estágios de projeto e produção de muitos produtos. É comumente usado hoje em dia em projetos de sistemas mecânicos e eletrônicos, operações seguras de fábricas, aquisição de produtos, entre outros.

No setor de TI, que com a transformação digital passou a ter um papel determinante para o futuro dos negócios em uma empresa, o MTBF contribui decisivamente para o gerenciamento de TI proativo, que busca um trabalho mais preventivo, focado no monitoramento e automação de processos.

Se a equipe de TI tem acesso aos indicadores sobre a quantidade de horas que um determinado ativo funcionará antes de apresentar uma nova falha, tem uma base a mais para trabalhar com antecipação de problemas, o que possibilita uma mitigação de falhas e aumento da disponibilidade da infraestrutura. O resultado é uma maior produtividade da empresa, maior competitividade em seu setor e aumento de receita.

Qual é a diferença entre MTBF e MTTR?

Como o setor de TI lida com sistemas ou equipamentos que podem ser reparados, o MTTR e o MTBF são duas das métricas mais analisadas e comparadas ao examinar as falhas que podem resultar em tempo de inatividade da infraestrutura. 

Então, qual é a diferença entre os dois? O tempo médio entre falhas (MTBF) é uma previsão do tempo entre as falhas de uma máquina durante o seu tempo de operação ou quanto tempo uma peça do equipamento opera sem interrupção. 

Já o MTTR é o cálculo que avalia a média de tempo que o equipamento demora para voltar à ativa, durante o seu tempo operacional, depois de uma parada. Em suma, é o tempo que a equipe de TI leva para avaliar o problema e solucioná-lo a cada parada. Para fazer o cálculo do MTTR, basta dividir o tempo total de reparo pela quantidade de falhas.

  • MTTR = (Tempo total de reparo) / (quantidade de falhas)

Usando o exemplo acima do cálculo do MTBF teremos a seguinte solução:

  • MTTR = (3 + 2 + 0,5) / 3 = 1,83 horas.

Com esse cálculo, o gestor passa a identificar o tempo médio que cada ativo fica parado quando apresenta um problema, sendo que, quanto menor for o MTTR, maior será a eficiência da equipe.

Como calcular o tempo de atividade (Uptime)?

Agora que já sabemos a diferença entre MTBF e MTTR, vamos entender como é a relação entre esses dois indicadores. Imagine o seguinte cenário: o seu servidor deveria estar em operação durante 24 horas, mas esteve inoperante por 5 horas e meia. Isso significa que ele esteve disponível por 18 horas e meia e passou por um total de 3 falhas. 

Dessa maneira, podemos unir os indicadores MTBF e MTTR para fazer o cálculo de tempo de atividade de nosso servidor. A fórmula é: (MTBF / MTBF + MTTR). Já sabemos que o nosso MTBF é 6,16 horas e o MTTR 1,83 horas, assim sendo:

Cálculo de tempo de atividade (Uptime): 6,16 / (6,16 + 1,83) = 0,77 (77%).

Se considerarmos que o ideal é que o Uptime esteja sempre o mais próximo possível de 100%, o nosso servidor estará bem abaixo das expectativas e precisará de uma atenção especial do gestor.

Como vimos, o cálculo do MTBF é de extrema importância para que o gestor de TI monitore a disponibilidade da infraestrutura, a qualidade dos ativos e a performance da equipe. Tudo isso fica mais fácil quando há a utilização de um bom sistema de gestão, que facilite a criação de um banco de dados unificado e ofereça ferramentas de análise desses dados em tempo real. Além disso, a sua empresa pode contar com uma consultoria de TI, que ajudará na elaboração de planos de mitigação de gargalos e aumento de Uptime.

Gostou do post? Então curta a nossa página no Facebook e receba outras dicas como esta.

Contato

Deixe um comentário