Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Manutenção e reparo de equipamentos

O que é a análise da árvore de falhas e como realizá-la



Não seria incrível se você tivesse o poder de olhar para o futuro e identificar falhas em seu sistema antes que elas aconteçam? Que superpotência seria! Para sua sorte, você não precisa de superpoderes. Você tem análise de árvore de falha.

A análise da árvore de falhas é uma das muitas técnicas para encontrar as causas raízes das falhas de ativos e outros eventos importantes. Muitas empresas diferentes estão usando para melhorar a confiabilidade do sistema.

Vamos dar uma olhada na história por trás da Análise da Árvore de Falhas e quando usá-la. Em breve, você terá um conhecimento sólido dos diferentes tipos, símbolos e abordagens, bem como soluções de software úteis para prepará-lo para o sucesso.

O que é análise de árvore de falha?


Análise de árvore de falha ( FTA ) é uma ferramenta para analisar o potencial de falha do sistema ou da máquina, representando gráfica e matematicamente o próprio sistema. É uma abordagem de cima para baixo que faz a engenharia reversa das causas raiz de uma falha potencial por meio do processo de análise de causa raiz.

Em outras palavras, se você se perguntar “qual a probabilidade de esta máquina quebrar”, a análise da árvore de falhas o ajudará a responder a essa pergunta.

O FTA replica como a falha se move através de um sistema. Ele cria um modelo gráfico de como as falhas de componentes levam a falhas em todo o sistema. Esses modelos ajudam os engenheiros de confiabilidade a criar sistemas bem definidos com as redundâncias adequadas que evitam que as falhas de componentes se transformem em falhas em todo o sistema - em outras palavras, criam sistemas mais tolerantes a falhas.

Mesmo que o processo pareça ciência de foguetes, os termos usados ​​no FTA são bastante diretos.

Os gráficos analíticos usados ​​para modelar FTA's se parecem com árvores, então (sem surpresa) eles são chamados de árvores de falha . O diagrama da árvore de falhas o ajudará a entender como um ou mais pequenos eventos de falha levam a uma falha catastrófica. Isso o ajudará a escolher as medidas corretivas e preventivas corretas no futuro.

A história por trás da análise da árvore de falhas


Em 1962, a Bell Telephone Laboratories projetou salvaguardas para o sistema de mísseis balísticos intercontinentais (ICBM) para a Força Aérea dos Estados Unidos, denominado Sistema Minuteman. A segurança era vital para uma tecnologia tão complexa e perigosa. Para melhorar sua análise de confiabilidade, a Bell Laboratories criou o método de análise de árvore de falhas.

Essa nova metodologia adicionou um elemento gráfico que ajudou a visualizar os conceitos de Análise de Modos e Efeitos de Falha (FMEA) - um método semelhante, mas muito relacionado, de prevenção de falhas. Mais tarde, a Boeing adotou o FTA, tornando-o um método de análise popular amplamente usado hoje para analisar o potencial de falha de sistemas críticos.

Essa análise rigorosa garante que sistemas complexos operem com segurança e confiabilidade, mantendo os aviões voando, os carros dirigindo e o mundo ao nosso redor funcionando com a eficiência que deveria. Incrível né !?


via GIPHY

Quando usar a análise de árvore de falha


Análise da árvore de falhas pode ser feito no momento do projeto do sistema ou durante a operação (para antecipar falhas potenciais e tomar ações preventivas). O objetivo é impulsionar os subsistemas e componentes que têm grande probabilidade de falhar ou causar um grande incidente antes que realmente aconteça.
Pode ser implementado sozinho ou como um complemento à análise FMEA.

Quem usa FTA e por quê?


Em geral, a análise da árvore de falhas ajuda a prevenir falhas futuras e identificar áreas críticas de preocupação para novos fluxos de trabalho, produtos e serviços. É por isso que várias indústrias usam FTA como um método para análise de segurança e mitigação de riscos como:

Observe um tema aqui? Essas são indústrias que podem ter impactos significativos na vida das pessoas se algo der errado. Quando um avião cai ou um dispositivo de saúde não funciona como deveria, o risco de vidas perdidas ou outros eventos trágicos é alto. FTA é o que essas indústrias usam para manter seguras as atividades de alto risco.

Por que a análise da árvore de falhas vale o esforço


FTA pode ser um tópico técnico com muita matemática e solução de problemas. Mas existem alguns benefícios notáveis ​​em conhecê-lo e colocá-lo para funcionar em sua empresa. Isto:

Com todos esses benefícios, faz sentido trazer o FTA para sua caixa de ferramentas de análise. Com ele, você tem o poder de ver o futuro e prever coisas. Você é um mago dedutivo e todo-poderoso!

Símbolos e estrutura de análise de árvore de falha


FTA é executado através da construção de árvores de falhas . As árvores de falha têm um conjunto padrão de símbolos e regras de nomenclatura usados ​​em fábricas e indústrias.

A árvore de falhas é um gráfico acíclico direcionado (DAG) (ou seja, você o lerá em uma direção do início ao fim) que mostra o fluxo e a relação entre uma série de atividades. As atividades são categorizadas como eventos ou portas .

Símbolos de eventos


Os eventos acontecem em um sistema ou processo e podem causar ou contribuir para uma falha, como a quebra de um componente individual. Descrevemos os eventos que aparecem nas árvores de falhas abaixo. Os símbolos de eventos terão apenas uma entrada e uma saída.



Aqui está uma breve descrição do significado de cada evento

Símbolos de portão


As portas, às vezes chamadas de portas lógicas, representam como as falhas se espalham pelo sistema. Ocasionalmente, um único evento pode resultar em um evento de nível superior (ou seja, falha catastrófica). Outras vezes, uma combinação de dois ou mais eventos diferentes pode causar o evento principal. É aqui que entra o conceito de lógica booleana.

As portas representam os operadores lógicos booleanos (AND, OR, UNION, NOT, etc.) e mostram como os eventos se combinam para causar a falha. Cada porta terá apenas um evento de saída, mas pode ter um ou mais eventos de entrada.



As portas mais utilizadas no desenho de árvores de falhas são descritas a seguir:

Tipos de análise de árvore de falha


A análise de árvore de falha padrão não é o único método disponível. Outras extensões do FTA foram desenvolvidas para casos de uso e setores específicos. As extensões seriam capazes de visualizar características que não são facilmente expressas por árvores de falhas padrão. Alguns deles são:
  • Dinâmico FTA :Árvores de falha dinâmica (DFT) estendem as árvores de falha padrão modelando comportamentos e interações de componentes complexos do sistema.
  • Reparável FTA :Árvores de falhas reparáveis ​​(RFT) aprimoram o modelo FTA, introduzindo a possibilidade de descrever reparos dependentes complexos de componentes do sistema.
  • Estendido FTA :Leva em consideração componentes de vários estados e probabilidades aleatórias.
  • Fuzzy FTA :Leva em consideração fatores não confiáveis ​​que são difíceis de prever (como o vento ou o clima) com um conceito matemático complexo chamado teoria dos conjuntos difusos.
  • Evento estadual FTA :SEFT é usado para analisar o comportamento dinâmico que as árvores de falha comuns não podem modelar.

De modo geral, os FTAs ​​se enquadram em duas categorias; qualitativo e quantitativo .

A análise qualitativa é realizada todas as vezes, enquanto a análise quantitativa pode ser feita como um complemento em situações em que você conhece as probabilidades dos eventos em sua árvore de falhas. Vamos dar uma olhada mais profunda em cada um deles.

FTA qualitativo


O FTA qualitativo é usado para obter informações sobre a estrutura das árvores de falhas para analisar as vulnerabilidades de um sistema. Existem muitas maneiras diferentes de conduzir a análise qualitativa da árvore de falhas, como:
  • Conjuntos de cortes mínimos (MCS) ajudar a identificar as vulnerabilidades de um sistema. Se um FT contiver um pequeno número de componentes ou um conjunto de elementos com alta probabilidade de falha, o sistema será considerado não confiável. O MCS identifica esses conjuntos de elementos em uma árvore de falhas. Se você puder reduzir a probabilidade de falha de alguns componentes ou adicionar redundâncias, você aumentará a confiabilidade do sistema.
  • Conjuntos de caminhos mínimos (MPS) irá ajudá-lo a determinar a robustez de um sistema. Tenta identificar o conjunto mínimo de componentes que podem manter o sistema funcional. Depois que esses elementos forem identificados, você pode passar um tempo trabalhando para diminuir a chance de eles falharem. Isso aumenta a confiabilidade geral do sistema.
  • Causa comum falhas (CCF) determinar se várias falhas podem ser causadas por um único elemento. Os componentes identificados por meio do CCF são considerados componentes críticos. Sua equipe precisa garantir que esses componentes sejam inspecionados e substituídos rotineiramente (conforme necessário). Um sistema de gerenciamento de manutenção computadorizado (CMMS) como o Limble pode planejar e programar a manutenção desses componentes críticos.

FTA quantitativo


O FTA quantitativo pode ser usado para calcular a probabilidade real da falha que você está analisando. Atribuir essa probabilidade numérica de falha o ajudará a entender melhor e priorizar seu risco.

O resultado do FTA quantitativo pode ser na forma de medidas estocásticas ou de importância:
  • Medidas estocásticas fornecem a probabilidade de falha do sistema.
  • Medidas de importância atribuir o nível de importância que um conjunto de corte ou caminho representa para a confiabilidade de todo o sistema.

Quando você conhece a probabilidade de seus eventos básicos, pode calcular facilmente as probabilidades de seus eventos intermediários com base nas portas que os conectam. As portas mais comuns são portas AND e portas OR. Aqui está um exemplo simples.


Um exemplo de método FTA quantitativo

Aqui, A, B, C e D são eventos básicos. E é um evento intermediário e TE é o evento principal. O evento intermediário E é conectado aos eventos básicos A, B e C usando uma porta AND. A, B e C precisam falhar para que o evento intermediário E aconteça. As probabilidades de falha para A, B e C são conhecidas. Portanto:




A falha de evento principal TE é alcançada conectando E e D através de uma porta OR. E em si é um evento de falha e a probabilidade de ocorrência do evento básico D é conhecida.



A probabilidade de falhas no evento principal pode ser calculada assim, usando o método FTA qualitativo.

Passos que você pode seguir ao conduzir a análise da árvore de falhas


Mapeamos as etapas gerais que você deve seguir para concluir a análise da árvore de falhas.

Etapa 1:Construir uma equipe diversificada


Ao lidar com sistemas complexos, você deseja vozes diferentes na sala.

Profissionais experientes na área serão capazes de consultar experiências anteriores de sua vida profissional. Eles também estarão cientes dos aspectos técnicos do sistema que mais os afetam. Outros membros da equipe com menos conhecimento técnico podem contribuir apresentando ideias inovadoras e outras informações úteis.

Sessões de brainstorming e reuniões precisam de um líder, alguém com experiência na condução de ALCs. Engenheiros dos respectivos campos, engenheiros industriais e especialistas em design de sistema são necessários para qualquer equipe de FTA.

Etapa 2:Identificar as causas da falha


O FTA funciona de cima para baixo. Comece com o evento principal e, em seguida, tente identificar as várias falhas que podem causar ou contribuir para ele. Se você continuar cavando para construir a partir de cada evento, isso acabará por levá-lo às causas raízes (agora isso é o que chamamos de sujar as mãos!). Você ficará com uma bela árvore de falhas.

Falhas potenciais, suas características, duração e diferentes impactos da falha devem ser definidos para iniciar e concluir o processo. Tome as portas corta-fogo em uma área de alto tráfego ou fábrica como exemplo.

Essas portas são mantidas abertas até que falhe energia ou o alarme de incêndio seja acionado. Se o alarme de incêndio estiver com defeito, há um problema com a fiação, as baterias de backup estão fracas ou alguém as adulterou. O alarme fará com que as portas fechem quando não deveria. Resultando em uma falha de baixo nível, mas que pode causar grande frustração e interromper toda a organização.

Etapa 3:compreender o funcionamento interno do sistema


A equipe que realiza o FTA precisa ter um conhecimento profundo do funcionamento interno do sistema. Os engenheiros que trabalham no nível do sistema terão uma boa ideia de como tudo funciona e quais falhas você deseja evitar. Outros membros da equipe podem, então, levantar questões que resultem em uma lista expandida de causas de falha que valem a pena explorar.

Alguém com conhecimento e experiência no sistema deve ser responsável por orientar a discussão. O objetivo é obter uma boa compreensão dos requisitos, conexões e dependências do sistema.

Sua equipe deve coletar os esquemas do sistema, as especificações dos diferentes componentes e outras informações disponíveis do fabricante. Se você estiver usando Limble CMMS, essas especificações de ativos estão disponíveis com o toque de um botão. O estudo desses materiais deve criar uma compreensão de como cada subsistema e componente estão conectados uns aos outros.

Etapa 4:Desenhe o diagrama FTA


Depois que a equipe entende o funcionamento interno do sistema, a próxima etapa é apresentar graficamente um mapa funcional do sistema usando a lógica booleana. Usando os símbolos e a estrutura da árvore de falhas acima, sua equipe pode desenhar a representação gráfica do sistema e como eles estão todos conectados.

Etapa 5:Identificar MCS, MPS ou CCF


Após a conclusão das árvores de falhas, sua equipe pode identificar MCS, MPS ou CCF com base no que desejam realizar.
  • MCS ou conjuntos de corte mínimo são identificados para conhecer as partes mais vulneráveis ​​do sistema.
  • MPS ou conjuntos de caminhos mínimos são determinados para identificar os principais componentes e subsistemas necessários para permanecer operacionais.
  • CCF identifica os componentes que causam o número máximo de falhas .

Seu motivo para realizar FTA em primeiro lugar determinará se a equipe precisa encontrar MCS, MPS, CCF ou uma combinação dos três.

Etapa opcional:Avalie a probabilidade de falha


Na maioria das vezes, você encontrará vários caminhos que podem levar ao mesmo evento de falha. Para um sistema extenso, seria quase impossível abordar todas as causas de falha de uma vez.

Para priorizar quais eventos abordar primeiro, a equipe pode calcular as probabilidades de cada falha para diferentes conjuntos críticos. O conjunto crítico com a maior chance de falha deve receber prioridade máxima.

Esta é uma etapa opcional, mas valiosa. Se você conhece a probabilidade de cada falha, valerá a pena usá-los!

Etapa 6:Desenvolver estratégias de mitigação de risco


Agora é hora de usar a análise da árvore de falhas para minimizar o risco de falha.
  • Alta prioridade deve ser dada para proteger o MPS (o conjunto mínimo de componentes para manter o sistema operacional).
  • Cronogramas de manutenção rígidos devem ser mantidos para CCFs, pois eles podem causar uma infinidade de problemas.

Uma estratégia de mitigação de risco potencial, especialmente para CCFs, é manutenção preventiva .

Um sistema CMMS como o Limble pode ajudá-lo a garantir o cumprimento dos cronogramas de manutenção exigidos. Isso inclui seguir as melhores práticas para o gerenciamento de peças de reposição, para que a equipe de manutenção sempre tenha componentes de reposição em estoque. Esse esforço deve ser feito para minimizar a probabilidade de falha.

Exemplos de análise de árvore de falha


Aqui estão dois exemplos diferentes de análise de árvore de falha para ajudar a pintar o quadro de como o processo funciona.

O carro não pega



exemplo FTA para um carro que não pega

* A explicação que damos abaixo não corresponde diretamente ao FTA mostrado acima. Queríamos dar uma explicação mais prática do que “tire o pé do freio” para ligar o carro 🙂

Você acorda uma manhã e se prepara para o trabalho. Você entra no carro, vira a chave e - nada. Seu carro não pega. Não está nem virando.

Sabendo uma coisa ou duas sobre carros, você salta, abre o capô e verifica a bateria. Em seguida, você verifica o medidor de gasolina para ter certeza de que não está sem gasolina antes de voltar para o carro para garantir que as luzes não foram deixadas acesas durante a noite.

Neste exemplo, o carro que não deu partida é a falha ou Evento Principal (TE). As três opções de por que o carro não dá a partida estão todas conectadas por um portão OR, o que significa que qualquer um ou uma combinação dos três pode fazer com que o veículo não dê partida.

Indo um passo adiante, ao verificar a bateria, você tem algumas coisas que podem causar a falha. A bateria está velha e precisa ser substituída ou está vazia e precisa ser substituída. A próxima pergunta a fazer seria por que a bateria está vazia. Se os faróis ficaram acesos, sua próxima tarefa é determinar como evitar isso no futuro? Certifique-se de verificá-los antes de sair do carro.

Suponha que você queira calcular a probabilidade de falha. Nesse caso, você precisa atribuir um número que representa a probabilidade de ocorrência dos eventos e, em seguida, usar o método FTA qualitativo para calcular a falha do evento principal.

Servidor experimenta uma falha catastrófica


Este exemplo é mais técnico do que o anterior. Digamos que você tenha um servidor que armazena dados críticos e passa por uma falha catastrófica.


Exemplo de análise de árvore de falha para uma falha de servidor

Aqui estão algumas explicações rápidas para certos elementos:

  • B é um barramento de sistema não redundante.
  • PS é a fonte de alimentação do servidor.
  • C1 e C2 são duas unidades de processamento central (CPUs) redundantes para o servidor, o que significa que uma das duas CPUs pode falhar sem causar falha total do sistema.
  • M1, M2 e M3 são componentes de memória que podem ser compartilhados entre as duas CPUs.

Esta árvore de falhas mapeia o caminho, conjuntos de cortes e probabilidades de ocorrência do evento principal (falha do sistema).

A falha se espalha dos eventos básicos para o evento principal através dos portões G1 - G6. A porta G1 é uma porta INIBIDA com a condição de que a falha do sistema ocorrerá apenas quando o sistema estiver em uso. Isso significa que as falhas podem ser reparadas durante o tempo de inatividade programado alocado para manutenção. A porta G2 indica que a falha de qualquer evento básico B ou a falha do subsistema propagou-se até G3. A porta G3 falha apenas quando ambos os subsistemas da CPU (com C1 e C2) falham.

Cada subsistema da CPU consiste na fonte de alimentação (PS), CPU (C1 ou C2) e componente de memória propagado por G6. Cada subsistema da CPU falhará se a fonte de alimentação, as CPUs ou o componente de memória falhar. A falha em um nível acima acontecerá apenas se ambos os subsistemas da CPU falharem. G6 é uma porta de votação e, para a falha na propagação, pelo menos dois dos três componentes da memória devem falhar.

As expressões booleanas para o sistema são as seguintes (o ∩ representa o operador booleano “união”, que é basicamente onde a função de dois componentes se junta ou se sobrepõe):
  • G1 =U ∩ G2
  • G2 =B ∩ G3

Combinar os dois nos leva a:
  • G1 =U ∩ (B ∩ G3)
  • G1 =(U ∩ B) ∪ (U ∩ G3)

Você pode continuar dessa maneira até que todos os eventos intermediários sejam eliminados e apenas os eventos básicos permaneçam para levá-lo aos conjuntos de cortes mínimos. Esta é a abordagem de cima para baixo.

Uma vez que as probabilidades dos eventos básicos não são declaradas, você não pode realizar uma análise quantitativa.

Se não satisfizemos seus desejos por portas lógicas e diagramas, você pode encontrar vários exemplos de FTA adicionais aqui.

Análise da árvore de falhas em comparação com outros métodos analíticos


A FTA não é a única metodologia analítica que existe. Vamos dar uma olhada em alguns outros para ver como eles se comparam.

FMEA


Enquanto o FTA usa um método de cima para baixo para avaliar pontos de falha, Modos de falha e análise de efeito ou FMEA usa uma abordagem ascendente. Ele questiona o que pode dar errado em cada etapa que pode causar falha em vez de examinar a falha primeiro.

Além disso, o FMEA não olha para a relação entre diferentes eventos ou eventos condicionais da mesma forma que o FTA. Portanto, FTA é uma análise mais complexa, mas completa.

FMECA


Modo de falha análise de efeitos e criticidade (FMECA) é fácil de entender. É como FMEA, mas adiciona uma análise de criticidade ou lista de classificação. FMEA analisa uma longa lista de "e se" FMECA permite classificar as falhas para que você possa planejar e priorizar melhor o seu trabalho.

ETA


Árvore de eventos focos de análise em perguntas específicas e respondendo-as de uma forma muito direta. Além disso, não tem o uso geral que a análise de árvore de falhas tem. Geralmente é usado em indústrias financeiras.

Simplificando o processo com software FTA


O FTA para sistemas grandes e complexos pode rapidamente se tornar tão grande que não pode ser desenhado em uma única página ou quadro branco. Você pode contornar isso usando elementos de transferência testados e comprovados. No entanto, mesmo com eles, o diagrama pode se tornar muito grande para ser manuseado, lido e compreendido. O software de análise de árvore de falhas é uma excelente solução para esse tipo de problema.

Além de simplificar a representação gráfica, alguns aplicativos têm algoritmos que podem identificar automaticamente aspectos quantitativos do FTA, como MCS, MPS e CCF. Se você conhece a probabilidade de falha de seus eventos básicos, as probabilidades de eventos principais e falhas de subsistema podem ser calculadas com o clique de um botão.

Aqui estão alguns sistemas que você pode experimentar:
  • Paradigma visual:software FTA rico em recursos com avaliação gratuita.
  • Blocksim:software FTA que faz parte de um conjunto de aplicativos de software de confiabilidade da ReliaSoft.
  • Analisador de árvore de falhas ALD:um software FTA gratuito baseado em nuvem.

Essas não são, de forma alguma, todas as soluções disponíveis, apenas as mais populares. Existem muitos por aí com recursos adicionais adequados para diferentes usos. Pesquise para encontrar o produto certo para você com base em seu propósito e setor específicos.

Recursos adicionais


Como você pode ver, muita pesquisa e experiência foram dedicadas ao desenvolvimento do processo de Análise de Árvore de Falhas. Se você quiser se aprofundar neste assunto, verifique estes recursos adicionais:
  • Livro:Fault Tree Analysis Primer, de Clifton A Ericson II
  • Livro:Análise da árvore de falhas, um guia completo de Gerardus Blokdyk
  • Palestra do Coursera sobre FTA
  • palestra FTA no YouTube pelo Departamento de Engenharia de Sistemas Ans Industrial da IIT Kharagpur
  • Mais uma palestra da FTA no Youtube pela xSeriCon, empresa de consultoria em engenharia e treinamento em segurança.

Resumindo

A análise da árvore de falhas pode certamente ser complexa. Se você reunir a equipe certa e praticar o suficiente, começará a sentir que pode olhar para o futuro e antecipar as falhas e suas causas. Você será o assistente que planeja o reparo de falhas no tempo de inatividade para manutenção programada e mantém sua equipe trabalhando de forma proativa mais do que reativamente.


via GIPHY

Na Limble, estamos aqui para apoiá-lo em todas as etapas do caminho. Nosso sistema CMMS abrigará todas as informações de que você e sua equipe precisam para construir FTAs ​​com eficácia, gerenciar atividades para mitigar riscos e muito mais. É nossa missão tornar seu trabalho o mais fácil e simplificado possível. Entre em contato conosco em caso de dúvidas ou para ver como nosso CMMS pode apoiá-lo.

Manutenção e reparo de equipamentos

  1. Análise de criticidade:o que é e por que é importante
  2. O quê, por quê e como usar a chave inglesa
  3. Análise de criticidade:O que é e como é feito?
  4. O que é 6G e quão rápido será?
  5. O que é a cavitação da bomba e como evitá-la?
  6. O que é o corte a plasma e como funciona o corte a plasma?
  7. O que é solda? - Tipos e como soldar
  8. O que é brasagem e como brasar metal?
  9. O que é brasagem de cobre e como fazê-lo?
  10. O que é Lean Digital e como integrá-lo?