{"id":4942,"date":"2019-09-18T15:03:51","date_gmt":"2019-09-18T15:03:51","guid":{"rendered":"https:\/\/www.midomenech.com.br\/?p=4942"},"modified":"2021-06-01T16:12:29","modified_gmt":"2021-06-01T19:12:29","slug":"paradoxo-de-simpson-e-a-amostragem-2","status":"publish","type":"post","link":"https:\/\/www.midomenech.com.br\/paradoxo-de-simpson-e-a-amostragem-2\/","title":{"rendered":"Paradoxo de Simpson"},"content":{"rendered":"\t\t
<\/p>\n
<\/p>\n
<\/p>\n
<\/p>\n
Paradoxo de Simpson e a amostragem – Ser\u00e1 que a forma em que coletamos os dados de um processo, pode influenciar nossas conclus\u00f5es?<\/p>\n
<\/p>\n
<\/p>\n
Uma das quest\u00f5es que consideramos mais importantes quando se trabalha em melhoria de processos \u00e9 a Estrat\u00e9gia de Amostragem (ver ilustra\u00e7\u00e3o do m\u00e9todo cient\u00edfico na Figura 1). Nos nossos cursos mostramos como escolher um plano de amostragem adequado conforme a situa\u00e7\u00e3o. Se o plano foi bem selecionado, a an\u00e1lise dos dados ser\u00e1 usualmente simples e a tomada de decis\u00f5es n\u00e3o ter\u00e1 riscos grandes de erros.<\/p>\n
<\/p>\n
<\/p>\n
Neste pequeno resumo mostramos que quando utilizamos dados hist\u00f3ricos agregados a partir de distintos estratos de forma desbalanceada, as conclus\u00f5es extra\u00eddas podem ser err\u00f4neas, devido entre outros motivos, ao paradoxo de Simpson.<\/p>\n
<\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 1 \u2013 Plano de amostragem no m\u00e9todo cient\u00edfico<\/p>\n <\/p>\n <\/p>\n Ilustremos o problema com dados tipo atributo relacionados com a porcentagem de refugo de dois produtos. Suponha que em dois meses foram produzidas 11.000 unidades do produto A e 55.000 unidades do produto B. O Controle de Qualidade (CQ) inspecionou 10% da produ\u00e7\u00e3o, ou seja, 1100 unidades de A e 5500 unidades de B. Destes totais, o CQ encontra as seguintes quantidades de produtos defeituosos:<\/p>\n <\/span><\/p>\n Produto<\/span><\/p>\n<\/td>\n Inspecionados<\/span><\/p>\n<\/td>\n Refugo<\/span><\/p>\n<\/td>\n % Refugo<\/span><\/p>\n<\/td>\n<\/tr>\n A<\/span><\/p>\n<\/td>\n 1100<\/span><\/p>\n<\/td>\n 110<\/span><\/p>\n<\/td>\n 10,0%<\/span><\/p>\n<\/td>\n<\/tr>\n B<\/span><\/p>\n<\/td>\n 5500<\/span><\/p>\n<\/td>\n 1003<\/span><\/p>\n<\/td>\n 18,2%<\/span><\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n O pessoal do Controle de Qualidade conclui que a porcentagem de refugo \u00e9 maior para o produto B do que para o A! Est\u00e1 certa esta conclus\u00e3o?<\/em> Talvez sim, talvez n\u00e3o! Inspecionemos os n\u00fameros com mais detalhes. Consideremos por exemplo o que aconteceu nos meses 1 e 2 com o refugo:<\/p> <\/span><\/p> M\u00eas<\/span><\/p><\/td> Produto<\/span><\/p><\/td> Inspecionados<\/span><\/p><\/td> Refugo<\/span><\/p><\/td> % Refugo<\/span><\/p><\/td><\/tr> 1<\/span><\/p><\/td> A<\/span><\/p><\/td> 1000<\/span><\/p><\/td> 80<\/span><\/p><\/td> 8,0%<\/span><\/p><\/td><\/tr> 1<\/span><\/p><\/td> B<\/span><\/p><\/td> 500<\/span><\/p><\/td> 3<\/span><\/p><\/td> 0,6%<\/span><\/p><\/td><\/tr> 2<\/span><\/p><\/td> A<\/span><\/p><\/td> 100<\/span><\/p><\/td> 30<\/span><\/p><\/td> 30,0%<\/span><\/p><\/td><\/tr> 2<\/span><\/p><\/td> B<\/span><\/p><\/td> 5000<\/span><\/p><\/td> 1000<\/span><\/p><\/td> 20,0%<\/span><\/p><\/td><\/tr><\/tbody><\/table><\/div>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Conclus\u00f5es e sugest\u00f5es:<\/strong><\/p>\n <\/p>\n <\/p>\n O paradoxo de Simpson \u00e9 gerado pela combina\u00e7\u00e3o de amostras de tamanhos distintos provenientes de v\u00e1rios estratos. Isto pode conduzir a conclus\u00f5es erradas. Para n\u00e3o cometer este tipo de erros h\u00e1 v\u00e1rios caminhos:<\/p>\n <\/p>\n <\/p>\n Carlos Domenech<\/em><\/p>\n <\/p>\n <\/p>\n<\/span><\/span><\/span><\/p>\n
<\/figure>\n
\n
\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n <\/figure>\n
<\/p>\n Quando comparamos as taxas de refugo dos produtos A e B para cada m\u00eas o panorama muda: realmente o produto A \u00e9 bem pior que o produto B. O interessante \u00e9 que este tipo de problema pode acontecer tanto com vari\u00e1veis atributos, quanto com vari\u00e1veis cont\u00ednuas.<\/figure>\n
\n