Saber Profundo – Tamanho de amostra e autocorrelação
- Quando os dados são coletados a intervalos muito curtos (a cada 10 minutos ou a cada hora), os dados tendem a ser autocorrelacionados
- Esta autocorrelação dá uma dica para diminuir a frequência de amostragem de sensores on-line ou de medições de laboratório
Tamanho de amostra e autocorrelação – O “Histo DOE” é um Master Black Belt que gosta muito do Lean Seis Sigma, do pensamento crítico, do pensamento estatístico e do estabelecimento de metas “BHAGs” (Big, Hairy, Audacious Goals, metas grandes, cabeludas e audaciosas) na notação de James Collins (Feitas para durar, 2007). Ele procura o Saber Profundo do Dr. Deming.
Em um artigo anterior revisamos o uso de dados autocorrelacionados para realizar análises de regressão. Neste artigo mostramos como se pode utilizar a informação da autocorrelação para diminuir a freqüência de amostragem sem perda significativa de informação (aumentando o espaçamento entre amostras sucessivas).
A autocorrelação aparece quando o período de aquisição dos dados é muito curto. Para entender o conceito de autocorrelação, lembre-se daquela brincadeira do telefone sem fio. Forma-se um círculo de pessoas. Uma cochicha no ouvido da pessoa mais próxima uma frase, quem tenta repetir a frase para a seguinte e assim sucessivamente. Responda à pergunta seguinte: “haverá mais concordância entre as frases de duas pessoas próximas ou entre as frases de duas pessoas mais afastadas?”.
Você pode extrapolar este conceito para dados de processo: se o intervalo entre amostras for pequeno, poderá existir correlação entre o valor e o seguinte. Podemos dizer que é a memória de curto prazo do processo. Quando esta correlação (autocorrelação) é grande, isso pode dar pistas para diminuir a frequência de amostragem.
A Figura 1 tem um exemplo de uma variável denominada “queima de sólidos” proveniente de um sensor on-line de uma caldeira de indústria de papel (o espaçamento entre os dados é de 30 minutos). Observa-se que dados próximos são muito semelhantes. A Figura 2 tem um gráfico feito entre esta variável e a variável defasada em uma unidade de tempo: a correlação entre uma observação e seguinte é quase perfeita. Finalmente na Figura 3 encontra-se a função de autocorrelação mostrando a correlação para distintas defasagens da variável (ou lag).
A Figura 4 tem dados de acidez de óleo de uma indústria de alimentos com espaçamento de 1 hora entre as observações. Os dados são provenientes de análise de laboratório. A Figura 5 mostra o gráfico de autocorrelação da acidez.
Redução da freqüência de amostragem
Os intervalos de confiança (linhas vermelhas da Figura 5) mostram quando a autocorrelação é estatisticamente diferente de zero. Isso acontece quando as barras verticais ficam fora do intervalo. Valores acima do limite superior indicam autocorrelação positiva estatisticamente significante. Valores abaixo do limite inferior indicam autocorrelação negativa estatisticamente diferente de zero.
A proposta de Histo DOE é que você aumente o intervalo entre medições até que a autocorrelação seja próxima de 0,6 (mesmo que ela seja significativa). A partir deste valor a autocorrelação é quase desprezível em termos práticos. Para o caso da caldeira isso significa passar a coletar dados uma vez por turno (lag = 15) enquanto que para a acidez significaria coletar dados a cada 10 horas (ou por conveniência poderia ser também uma vez por turno).
Nas Figuras 6 e 7 encontram-se os gráficos de Queima de Sólidos e Acidez com a frequência real e a frequência reduzida. Note que os gráficos com a frequência reduzida refletem bastante bem o formato do gráfico com a frequência real.
Conclusões:
- Se você tem dados de processos autocorrelacionados aproveite as dicas do artigo para reduzir a carga analítica, se este for seu interesse. Esta ideia é extremamente importante, por exemplo, em plantas químicas com alta frequência de amostragem ou em processos com dinâmica lenta, como, por exemplo, quando se acompanha a vida útil de poços de petróleo. Neste último caso pode-se diminuir a frequência de amostragem da variável BSW (basic sediments and water).
- Se a redução sugerida for muito extrema para os paradigmas reinantes no seu processo/empresa, tente reduzir a amostragem aos poucos. Exemplo: reduza primeiro a frequência pela metade.
- A redução da autocorrelação vai ter outra vantagem: redução de problemas na hora de utilizar ferramentas do tipo teste de hipótese já que a autocorrelação gera dependência entre os resíduos.
A Jornada Lean Six Sigma: Do White ao Master Black Belt
No mundo da gestão de processos e melhoria contínua, o Lean Six Sigma se destaca como uma metodologia poderosa para eliminar desperdícios, aumentar a
Design For Lean Six Sigma Estilo Startup
Você já passou por alguma/s destas situações? Desenvolve-se um programa (silo de ideias, inovação, motivação dos empregados, melhoria, liderança, …) e o tal programa não
Musk, o índice de idiotice, estilo Startup e Lean
Ao ler a biografia de Elon Musk de Walter Isaacson ficamos com a impressão de uma pessoa bastante questionável. Por outro lado, percebe-se a
O que é o Lean Six Sigma Estilo Startup?
Há um grande equívoco que deve ser desmistificado desde já: o Lean Six Sigma não é apenas uma ferramenta para gestão