{"id":8956,"date":"2024-11-18T15:49:15","date_gmt":"2024-11-18T18:49:15","guid":{"rendered":"https:\/\/www.midomenech.com.br\/?p=8956"},"modified":"2025-02-02T12:31:46","modified_gmt":"2025-02-02T15:31:46","slug":"ciencia-dos-dados-e-navalha-de-ockham","status":"publish","type":"post","link":"https:\/\/www.midomenech.com.br\/ciencia-dos-dados-e-navalha-de-ockham\/","title":{"rendered":"Ci\u00eancia dos Dados e Navalha de Ockham"},"content":{"rendered":"\t\t
\u00a0 A Navalha de Ockham<\/strong> afirma que a explica\u00e7\u00e3o mais simples \u00e9 prefer\u00edvel \u00e0 explica\u00e7\u00e3o mais complexa. Isso porque teorias simples s\u00e3o mais f\u00e1ceis de verificar e processos descomplicados s\u00e3o mais f\u00e1ceis de executar. A metodologia Lean \u00e9 um caso excelente da navalha de Ockham; procura sempre um caminho mais simples de executar um processo pela elimina\u00e7\u00e3o de desperd\u00edcios. J\u00e1 comentamos em outro artigo (\u201cMusk, o \u00edndice de idiotice, estilo Startup e Lean\u201d <\/span>https:\/\/www.linkedin.com\/pulse\/musk-o-%C3%ADndice-de-idiotice-estilo-startup-e-lean-midomenech-kfwkf\/<\/span><\/a>) como se pode usar o pensamento dos princ\u00edpios b\u00e1sicos para obter processos muito enxutos. Um livro interessante sobre o assunto \u00e9 \u201cElegant Solutions, May (2007)\u201d.<\/span>\u00a0<\/span><\/p> \u00a0 Mostramos neste artigo a import\u00e2ncia desse conceito ao lidar com an\u00e1lise de dados no Six Sigma. A navalha de Ockham est\u00e1 relacionada com a lei da parcim\u00f4nia, que procura usar o menor n\u00famero poss\u00edvel de fatores para explicar um fen\u00f4meno.<\/span>\u00a0<\/span><\/p> \u00a0 Para mostrar a utiliza\u00e7\u00e3o do princ\u00edpio da Navalha de Ockham, utilizamos um conjunto de dados de um artigo publicado por Jim Frost (Guide to Stepwise Regression and Best Subsets Regression, <\/span>https:\/\/statisticsbyjim.com\/regression\/guide-stepwise-best-subsets-regression\/#google_vignette<\/span><\/a>). O conjunto de dados utilizado pelo autor est\u00e1 em <\/span>https:\/\/statisticsbyjim.com\/wp-content\/uploads\/2017\/05\/ProductStrength.csv<\/span><\/a>. O exemplo est\u00e1 relacionado com a constru\u00e7\u00e3o de um modelo de um processo de fabrica\u00e7\u00e3o. Deseja-se avaliar como diversas vari\u00e1veis de processo (Temperatura, Press\u00e3o, Taxa, Concentra\u00e7\u00e3o e Tempo) est\u00e3o relacionadas \u00e0 resist\u00eancia de um produto.<\/span>\u00a0<\/span><\/p> Antecipando a conclus\u00e3o:<\/span>\u00a0<\/span><\/p> Um roteiro interessante de an\u00e1lise <\/span>\u00e9<\/span> representado na Figura 1.<\/span><\/span>\u00a0<\/span><\/p>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t \u00a0 Consideremos que os passos 1) e 2) j\u00e1 foram realizados. <\/span>Frost<\/span> pula a etapa 3) e vai direto<\/span> para <\/span>a constru\u00e7\u00e3o de um modelo de regress\u00e3o usando a metodologia <\/span>Stepwise<\/span>. <\/span>Essa an\u00e1lise n<\/span>o <\/span>Minitab<\/span> essa an\u00e1lise pode ser feita em Estat\\ Regress\u00e3o\\Ajuste de Modelo de Regress\u00e3o, ativando o m\u00e9todo <\/span>Stepwise<\/span> no bot\u00e3o \u201c<\/span>Stepwise<\/span>\u201d. O modelo resultante manteve as vari\u00e1veis <\/span>Temperatura, Press\u00e3o, Taxa e Concentra\u00e7\u00e3o<\/span> e eliminou a vari\u00e1vel Tempo do modelo; o valor de <\/span>R<\/span><\/span>2<\/span><\/span> ajustado <\/span>\u00e9<\/span> 87%<\/span>, indicando um <\/span>modelo bastante adequado, como se pode ver no gr\u00e1fico de valores ajustados versus Resist\u00eancia (Figura 2). O gr\u00e1fico de res\u00edduos n\u00e3o mostrou nada anormal no ajuste.<\/span><\/span>\u00a0<\/span><\/p>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t \u00a0 Mudamos agora a an\u00e1lise incluindo a etapa 3 de Explora\u00e7\u00e3o de dados. Como neste caso estamos preocupados <\/span>com a<\/span> correla\u00e7\u00e3o entre vari\u00e1veis, um gr\u00e1fico adequado pode ser o gr\u00e1fico de dispers\u00e3o. Utilizamos no <\/span>Minitab<\/span> o gr\u00e1fico Matriz de Dispers\u00e3o em Gr\u00e1fico\\Matriz de Dispers\u00e3o\\Simples. Adicionamos todas as vari\u00e1veis incluindo a resposta Resist\u00eancia. Obtemos o gr\u00e1fico da Figura 3.<\/span> Pelo gr\u00e1fico fica muito evidente que Resist\u00eancia est\u00e1 fortemente correlacionada com Tempo, de forma quadr\u00e1tica.<\/span><\/span>\u00a0<\/span><\/p>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t \u00a0 Agora sim podemos passar para a etapa 4) de Modelagem dos dados. Utilizamos o mesmo procedimento anterior Estat\\Regress\u00e3o\\Regress\u00e3o\\Ajuste de Modelo de Regress\u00e3o, preenchendo o menu como na Figura 4. No bot\u00e3o <\/span>Stepwise<\/span> desativamos o M\u00e9todo <\/span>Stepwise<\/span> (M\u00e9todo = Nenhum)<\/span>.<\/span><\/span>\u00a0<\/span><\/p>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t \u00a0 O modelo resultante tem somente a vari\u00e1vel Tempo (e Tempo^<\/span><\/span>2<\/span><\/span>) <\/span>como significativas. <\/span>O gr\u00e1fico da Figura 5 mostra a import\u00e2ncia e efeito de todas as vari\u00e1veis (significantes e n\u00e3o significantes). Claramente<\/span>, quando o Tempo permanece no modelo, a import\u00e2ncia das outras vari\u00e1veis sobre a <\/span>Resist\u00eancia<\/span> fica desprez\u00edvel.<\/span><\/span><\/p>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t \u00a0 Deixando somente a vari\u00e1vel Tempo e Tempo^<\/span><\/span>2<\/span><\/span> no modelo e refazendo a an\u00e1lise se chega a um modelo muito mais parcimonioso (a navalha de <\/span>Roteiro para An\u00e1lise dos Dados <\/H2>\n\t\t\t\t\t<\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t
\t\t\t\t\t\t\t\t\t\t\t
Modelagem sem Explora\u00e7\u00e3o de dados <\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t
\t\t\t\t\t\t\t\t\t\t\t
Modelagem com Explora\u00e7\u00e3o de dados <\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t
\t\t\t\t\t\t\t\t\t\t\t
\t\t\t\t\t\t\t\t\t\t\t
\t\t\t\t\t\t\t\t\t\t\t