{"id":4962,"date":"2019-09-18T15:15:54","date_gmt":"2019-09-18T15:15:54","guid":{"rendered":"https:\/\/www.midomenech.com.br\/?p=4962"},"modified":"2021-05-25T08:41:23","modified_gmt":"2021-05-25T11:41:23","slug":"saber-profundo-regressao-com-autocorrelacao","status":"publish","type":"post","link":"https:\/\/www.midomenech.com.br\/saber-profundo-regressao-com-autocorrelacao\/","title":{"rendered":"Saber profundo – Regress\u00e3o com autocorrela\u00e7\u00e3o"},"content":{"rendered":"\t\t
<\/p>\n
<\/p>\n
<\/p>\n
<\/p>\n
<\/p>\n
<\/p>\n
Regress\u00e3o com autocorrela\u00e7\u00e3o – O \u201cHisto DOE\u201d \u00e9 um Master Black Belt que gosta muito do Lean Seis Sigma, do pensamento cr\u00edtico, do pensamento estat\u00edstico e do estabelecimento de metas \u201cBHAGs\u201d (Big, Hairy, Audacious Goals, metas grandes, cabeludas e audaciosas) na nota\u00e7\u00e3o de James Collins (Feitas para durar, 2007). Ele procura o Saber Profundo do Dr. Deming.<\/p>\n
<\/p>\n
<\/p>\n
J\u00e1 alertamos em v\u00e1rios artigos que o uso de modelos de regress\u00e3o com dados hist\u00f3ricos deve ser feito com muito cuidado porque se n\u00e3o pode ser muito frustrante. Histo DOE j\u00e1 mostrou que sempre que poss\u00edvel dever\u00edamos usar dados experimentais planejados estatisticamente.<\/p>\n
<\/p>\n
<\/p>\n
Histo DOE quer mostrar neste trabalho que h\u00e1 outra situa\u00e7\u00e3o complicada nos dados hist\u00f3ricos que pode aparecer com certa freq\u00fc\u00eancia nos dias atuais pela disponibilidade de sistemas de aquisi\u00e7\u00e3o de dados (do tipo SDCD) em que o intervalo entre medidas consecutivas \u00e9 muito curto. Usualmente neste caso a vari\u00e1vel apresentar\u00e1 autocorrela\u00e7\u00e3o. O que \u00e9 isso? Alerta de Histo DOE: n\u00e3o fique muito assustado. N\u00e3o \u00e9 nenhuma pr\u00e1tica esot\u00e9rica ou estudo psicol\u00f3gico!<\/p>\n
<\/p>\n
<\/p>\n
Para entender o conceito de autocorrela\u00e7\u00e3o, lembre daquela brincadeira do telefone sem fio. Forma-se um c\u00edrculo de pessoas. Uma cochicha no ouvido da pessoa mais pr\u00f3xima uma frase, quem tenta repetir a frase para a seguinte e assim sucessivamente. Responda \u00e0 pergunta seguinte: \u201chaver\u00e1 mais concord\u00e2ncia entre as frases de duas pessoas pr\u00f3ximas ou entre as frases de duas pessoas mais afastadas?\u201d.<\/p>\n
<\/p>\n
<\/p>\n
Voc\u00ea pode extrapolar este conceito para dados de processo: se o intervalo entre amostras for pequeno, poder\u00e1 existir correla\u00e7\u00e3o entre o valor e o seguinte. Podemos dizer que \u00e9 a mem\u00f3ria de curto prazo do processo. Quando esta correla\u00e7\u00e3o (autocorrela\u00e7\u00e3o) \u00e9 grande, isso atrapalha um bocado na an\u00e1lise dos dados.<\/p>\n
<\/p>\n
<\/p>\n
A Figura 1 tem um exemplo de uma vari\u00e1vel denominada \u201cqueima de s\u00f3lidos\u201d. Observa-se que dados pr\u00f3ximos s\u00e3o muito semelhantes. A Figura 2 tem um gr\u00e1fico feito entre esta vari\u00e1vel e esta vari\u00e1vel defasada em 1 unidade de tempo: a correla\u00e7\u00e3o entre uma observa\u00e7\u00e3o e a observa\u00e7\u00e3o do lado \u00e9 quase perfeita. Finalmente na Figura 3 encontra-se a fun\u00e7\u00e3o de autocorrela\u00e7\u00e3o mostrando a correla\u00e7\u00e3o para distintas defasagens da vari\u00e1vel (ou lag).<\/p>\n
<\/p>\n
<\/p>\n <\/p>\n <\/p>\n Figura 1 \u2013 Queima de s\u00f3lidos. S\u00e9rie com autocorrela\u00e7\u00e3o positiva<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 2 \u2013 Diagrama de dispers\u00e3o entre queima de s\u00f3lidos e queima de s\u00f3lidos com defasagem de uma unidade<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 3 \u2013 Fun\u00e7\u00e3o de autocorrela\u00e7\u00e3o da vari\u00e1vel queima de s\u00f3lidos<\/p>\n <\/p>\n <\/p>\n Neste artigo da s\u00e9rie \u201cSaber Profundo\u201d estuda-se o seguinte problema. Imagine o processo da Figura 4 com destaque a 3 vari\u00e1veis de entrada e 1 de sa\u00edda. Suponha que todas as medidas foram coletadas com um espa\u00e7amento pequeno entre elas, por exemplo, a cada 10 minutos ou mesmo a cada hora. Mostraremos que embora existir correla\u00e7\u00e3o significativa entre y com cada um dos xs, a correla\u00e7\u00e3o entre alguns destes xs com y \u00e9 simplesmente uma \u201cmiragem\u201d causada pela autocorrela\u00e7\u00e3o. \u00c9 como se as s\u00e9ries apresentassem a mesma tend\u00eancia, mas somente por uma simples coincid\u00eancia. Mostramos no artigo como, as vezes, pode-se reconhecer estas falsas correla\u00e7\u00f5es de y versus x devido \u00e0 autocorrela\u00e7\u00e3o e como solucionar o problema. Em um pr\u00f3ximo artigo mostraremos como usar a informa\u00e7\u00e3o da autocorrela\u00e7\u00e3o para diminuir a freq\u00fc\u00eancia de amostragem sem perda de informa\u00e7\u00e3o (aumentando o espa\u00e7amento entre amostras sucessivas).<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 4 \u2013 Processo em estudo com 3 vari\u00e1veis xs e 1 vari\u00e1vel y<\/p>\n <\/p>\n <\/p>\n Na Tabela 1 h\u00e1 dados das vari\u00e1veis da Figura 4.<\/p>\n <\/p>\n <\/p>\n Tabela 1 \u2013 Dados de vari\u00e1veis autocorrelacionadas<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Podemos explorar estes dados usando gr\u00e1ficos de tend\u00eancia (Gr\u00e1fico\\ Gr\u00e1fico de S\u00e9ries Temporais\\ Simples) no Minitab (Figura 5) e gr\u00e1ficos de dispers\u00e3o (Gr\u00e1fico\\ Matriz de Dispers\u00e3o\\ Simples, Figura 6). Pelos gr\u00e1ficos parece existir correla\u00e7\u00e3o entre todos os xs e y. Confirmamos isto determinando a correla\u00e7\u00e3o simples entre cada x versus y (Estat\\ Estat\u00edsticas B\u00e1sicas\\ Correla\u00e7\u00e3o, Figura 7). A correla\u00e7\u00e3o entre x3 e y \u00e9 a mais forte, mas a correla\u00e7\u00e3o entre y = f(x1) e y = f(x2) n\u00e3o \u00e9 desprez\u00edvel.<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 5 \u2013 Gr\u00e1ficos de tend\u00eancia de y, x1, x2 e x3<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 6 \u2013 Gr\u00e1ficos de dispers\u00e3o de y, x1, x2 e x3<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 7 \u2013 Correla\u00e7\u00f5es simples entre as vari\u00e1veis y, x1, x2 e x3<\/p>\n <\/p>\n <\/p>\n Aqui usaremos uma ideia muito boa do nosso amigo Student (1914) mencionada no artigo de Bisgaard, S\u00f8ren and Kulahci, Murat (2006). Ele usava o pseud\u00f4nimo Student, era qu\u00edmico e trabalhava na cervejaria Guinness. Entre uma cerveja e outra ele teve a seguinte ideia: se uma vari\u00e1vel y est\u00e1 relacionada com outra no tempo t conforme o modelo:<\/p>\n <\/p>\n <\/p>\n yt = b0 + b1 xt (1)<\/p>\n <\/p>\n <\/p>\n ent\u00e3o ela estar\u00e1 correlacionada tamb\u00e9m no momento t-1 (com o mesmo modelo anterior):<\/p>\n <\/p>\n <\/p>\n yt-1 = b0 + b1 xt-1 (2)<\/p>\n <\/p>\n <\/p>\n Se fizermos a diferen\u00e7a entre os dois membros das equa\u00e7\u00f5es (1) e (2) veremos que o modelo se mant\u00e9m para as diferen\u00e7as (yt \u2013 yt-1):<\/p>\n <\/p>\n <\/p>\n (yt-yt-1) = b1 (xt-xt-1) (3)<\/p>\n <\/p>\n <\/p>\n Daqui encontramos uma forma de checar se a correla\u00e7\u00e3o y = f(x) \u00e9 realmente significante. O coeficiente angular da equa\u00e7\u00e3o em (1) deveria ser pr\u00f3ximo do coeficiente em (3) e tamb\u00e9m o coeficiente em (3) deve ser estatisticamente significante. Vejamos o que acontece com as vari\u00e1veis do nosso problema. A Figura 8 mostra que as vari\u00e1veis x1 e x2 t\u00eam rela\u00e7\u00e3o significante com y, mas a primeira diferen\u00e7a para x1 ou x2 n\u00e3o est\u00e3o correlacionadas com a primeira diferen\u00e7a de y. Logo, x1 e x2 n\u00e3o t\u00eam correla\u00e7\u00e3o significativa com y. A correla\u00e7\u00e3o que vemos \u00e9 uma miragem. A primeira diferen\u00e7a de x3 sim est\u00e1 correlacionada com a primeira diferen\u00e7a de y e o coeficiente angular \u00e9 quase id\u00eantico. Logo, x3 tem correla\u00e7\u00e3o significativa com y.<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 8 \u2013 Regress\u00f5es ajustadas entre y versus x1, x2 e x3 e entre as primeiras diferen\u00e7as de y com as primeiras diferen\u00e7as de x1, x2 e x3<\/p>\n <\/p>\n <\/p>\n Conclus\u00f5es:<\/strong><\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/strong><\/p>\n Refer\u00eancia:<\/strong><\/p>\n <\/p>\n <\/p>\n <\/p>\n<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
\n
\n