Saber Profundo – Normalidade?
- Há um culto exagerado à Normalidade nas análises estatísticas realizadas por Belts.
- Em cursos de GB observamos frases como: “distribuição normal significa que o processo é estável” ou “desvios da distribuição normal fornecem o ponto de partida para melhoria dos processos”.
- Será que a distribuição normal merece esse cuidado?
Normalidade? – O “Histo DOE” é um Master Black Belt que gosta muito do Lean Seis Sigma (LSS), do pensamento crítico, do pensamento estatístico e do estabelecimento de metas “BHAGs” (Big, Hairy, Audacious Goals, metas grandes, cabeludas e audaciosas) na notação de James Collins (Feitas para durar, 2007). Ele procura o Saber Profundo do Dr. Deming.
Desta vez ele gostaria de esclarecer alguns paradigmas referentes à distribuição Normal. Histo DOE vai tentar ajudar a muitos Belts que ficam atordoados quando a distribuição dos dados não é normal. Eles não sabem bem por que, mas parece que a casa cai. O projeto para!
Antes de continuar, responda da forma mais fiel possível (ninguém está olhando você neste momento!), qual é a ordem de importância dos requisitos mencionados abaixo para cada tipo de análise (se o requisito é o mais importante, coloque o número 1, para o 2º mais importante coloque o número 2 e assim por diante).
1) Estudo de capacidade do processo (capability analysis)
Distribuição Normal Estabilidade do processo
2) Teste de comparação de médias – ANOVA
Distribuição Normal Estabilidade do processo Variâncias iguais
3) Teste de comparação de variâncias – Bartlett
Distribuição Normal Estabilidade do processo Variâncias iguais
4) Regressão simples ou múltipla (resíduos)
Distribuição Normal Estabilidade Variância constante
Se você colocou que o requisito de normalidade está entre os mais importantes, você se enganou, a dizer verdade é o menos importante. A ordem de importância nos estudos acima é:
- Capacidade: Normalidade (2) Estabilidade (1)
- ANOVA: Normalidade (3) Estabilidade (1) Variâncias (2)
- Bartlett: Normalidade (2) Estabilidade (1)
- Regressão: Normalidade (3) Estabilidade (1) Variâncias (2)
Pois é, se você ficou revoltado com a afirmação acima, Histo DOE fica mais revoltado ainda quando vê um Belt desesperado pela falta de normalidade dos dados. Ele já tem visto situações em que o Belt faz análise de normalidade na etapa Medir somente para saber se pode ou não continuar com o projeto!
Comece a mudar seus paradigmas daqui para frente. O requisito mais importante em qualquer análise é o de estabilidade do processo (ou seja, quando o aspecto do gráfico de tendência permanece idêntico ao longo do tempo, ou em outras palavras, quando a média e variabilidade do processo permanecem constantes ao longo do tempo, ou quando o gráfico de Controle Estatístico de Processo não mostra causas especiais).
Capacidade do processo
Afastamentos significativos da forma da distribuição podem afetar de forma apreciável a capacidade, mas a instabilidade do processo é um problema muito maior porque impede fazer qualquer inferência sobre o desempenho do processo no futuro. Para os fins de estudos de capacidade Histo DOE sugere aprovar a normalidade da distribuição quando o teste apresentar p-value > 0,01.
Teste de médias
Se o processo for estável, o teorema central do limite garante que a distribuição será normal, mesmo para tamanhos de amostra relativamente pequenos. Conforme destacam BH2 (1978), os testes de médias são “robustos” à falta de normalidade: eles são pouco afetados quando a distribuição é não normal.
O segundo requisito importante é o de variâncias iguais. Conforme destaca Miller (1986), quando os tamanhos de amostras dos k grupos que estão sendo comparados são iguais (n1 = n2 = … = nk), este requisito perde sua importância. Por outro lado, o Minitab (a partir da versão 17) tem teste de médias para variâncias diferentes.
Teste de variâncias
Este é um caso em que a normalidade tem a maior importância dentre os estudos mencionados (embora aqui também não seja o mais importante). O teste de Bartlett se afeta bastante pela falta de normalidade. Nesse caso o Minitab sugere o teste de Levene.
Análise de regressão
A análise de regressão tem características semelhantes ao teste de hipótese de médias. As suposições neste caso valem para os resíduos, não para as observações originais.
Conclusões:
Histo DOE vai ficar feliz se você muda seu paradigma sobre a importância da distribuição normal e começa a usar um pouco mais de Saber Profundo em seus projetos! Metas mais arrojadas, projetos melhor controlados, implementações mais abrangentes.
Faça um favor se você gosta do LSS: da próxima vez que um colega ou um consultor exagere a importância da normalidade para o andamento dos projetos LSS, envie este trabalho para ele. É gratuito!
Referência:
- BH2: Box, G. E. P.; Hunter, W. G and Hunter J. S. (1978). Statistics for Experimenters: An Introduction to Design, Data Analysis, and Model Building. 1. ed. Wiley. ISBN: 0471093157.
- Miller, Rupert G. (1986). Beyond ANOVA, Basics of Applied Statistics. Ed. Wiley. ISBN: 0471819220.
Carlos Domenech
Em 50 palavras ou menos
Se tiver comentários sobre o assunto nos escreva!
Acesse nosso Instagram clicando aqui