{"id":4877,"date":"2019-09-18T13:28:38","date_gmt":"2019-09-18T13:28:38","guid":{"rendered":"https:\/\/www.midomenech.com.br\/?p=4877"},"modified":"2021-06-22T09:42:03","modified_gmt":"2021-06-22T12:42:03","slug":"banas-experimentos-com-dados-emparelhados","status":"publish","type":"post","link":"https:\/\/www.midomenech.com.br\/banas-experimentos-com-dados-emparelhados\/","title":{"rendered":"Banas \u2013 Experimentos com dados emparelhados"},"content":{"rendered":"\t\t
<\/p>\n
<\/p>\n
<\/p>\n
Introdu\u00e7\u00e3o a Experimentos com dados emparelhados<\/strong><\/p>\n <\/p>\n <\/p>\n \u00a0 \u00a0Os Green Belts e Black Belts s\u00e3o coordenadores de projetos de melhoria que utilizam a estrat\u00e9gia Seis Sigma. Com freq\u00fc\u00eancia conduzem experimentos simples para verificar se a mudan\u00e7a de um fator \u201cx\u201d afeta uma vari\u00e1vel de interesse, \u201cy\u201d. O experimento mais simples est\u00e1 relacionado com a compara\u00e7\u00e3o de duas condi\u00e7\u00f5es: condi\u00e7\u00e3o A versus condi\u00e7\u00e3o B, aparelho 1 versus aparelho 2, antes versus depois.\u00a0H\u00e1 duas formas poss\u00edveis de conduzir este tipo de experimentos:<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n \u00a0 A diferen\u00e7a entre as duas estrat\u00e9gias foi ilustrada na Figura 1.<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 1 \u2013 Experimentos dos t\u00eanis com amostras independentes ou emparelhadas<\/p>\n <\/p>\n <\/p>\n \u00a0 Suponha que nosso amigo Black Belt, Histo DOE, deseja avaliar dois tipos de t\u00eanis em rela\u00e7\u00e3o ao desgaste da sola: t\u00eanis Rosa versus t\u00eanis Verde. A forma mais simples de fazer o experimento seria escolher, ao acaso, um grupo de meninos e cal\u00e7\u00e1-los com t\u00eanis R e cal\u00e7ar um outro grupo com t\u00eanis V. Este tipo de experimento se conhece com o nome de amostras independentes.<\/p>\n <\/p>\n <\/p>\n \u00a0 Histo DOE, por outro lado, poderia pensar: \u201cem cada grupo podem existir meninos muito ativos e meninos que ficam o dia todo na frente da TV comendo pipoca. Isto poder\u00e1 fazer com que a variabilidade dos resultados entre os meninos dentro de cada grupo seja muito grande e dessa forma ser\u00e1 dif\u00edcil encontrar diferen\u00e7as entre os grupos. Eu poderia fazer com que cada menino cal\u00e7asse os dois t\u00eanis e ent\u00e3o ver para cada menino qual t\u00eanis desgasta mais. Escolho aleatoriamente para cada menino o p\u00e9 no qual cal\u00e7ar\u00e1 o t\u00eanis R. No outro p\u00e9 cal\u00e7ar\u00e1 o t\u00eanis V. N\u00e3o vai ficar muito chique, mas acredito que a meninada n\u00e3o vai se incomodar. Desta forma farei a compara\u00e7\u00e3o dentro de cada menino. As diferen\u00e7as entre os meninos ser\u00e3o eliminadas e o experimento ter\u00e1 maior sensibilidade para detectar diferen\u00e7as entre os tipos de solas\u201d. Esta classe de experimentos se conhece com o nome de amostras dependentes ou emparelhadas.<\/p>\n <\/p>\n <\/p>\n Aplica\u00e7\u00e3o e an\u00e1lise de resultados<\/strong><\/p>\n <\/p>\n <\/p>\n \u00a0 Histo DOE \u00e9 um apaixonado pelo Seis Sigma e pelo ciclo DMAIC utilizado para a melhoria dos processos. Cada fase tem sua peculiaridade; por exemplo, a etapa Definir \u00e9 importante para dar o rumo certo \u00e0 equipe de projeto. Muitas vezes o sucesso ou insucesso do projeto \u00e9 determinado nesta etapa. Nela determina-se o escopo, objetivo, dedica\u00e7\u00e3o da equipe e se escolhe o l\u00edder. A etapa Medir \u00e9 na maioria das vezes a mais trabalhosa e frustrante, j\u00e1 que nela se percebe a baixa qualidade dos dados e informa\u00e7\u00f5es que se encontram em quase todo tipo de empresa. A etapa, Analisar, \u00e9 muitas vezes a mais rica. Nela a equipe do projeto come\u00e7a com a descoberta das causas raiz que afetam os resultados do processo. \u00c9 nesta etapa e na pr\u00f3xima (Melhorar) que a experimenta\u00e7\u00e3o tem seu papel mais ativo.<\/p>\n <\/p>\n <\/p>\n Caso 1<\/strong>: <\/p>\n <\/p>\n Tabela 1 \u2013 Resultados de desgaste dos t\u00eanis R e V (amostras emparelhadas)<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n \u00a0 Da Figura 2 \u00e9 poss\u00edvel inferir com uma grande chance de certeza (mais de 99% de confian\u00e7a) que a nova formula\u00e7\u00e3o \u00e9 eficaz (p-valor = 0,000). Neste caso usamos o procedimento no Minitab \u201cEstat\\ Estat\u00edsticas B\u00e1sicas\\ Teste t pareado\u201d. Vejamos agora o resultado que poderia ter sido observado se o experimento tivesse sido conduzido com amostras independentes. Suponha que os resultados do experimento fossem os mesmos que os apresentados na Tabela 1 (mas suponha que os resultados de um t\u00eanis e do outro s\u00e3o correspondentes a meninos diferentes). A aplica\u00e7\u00e3o do teste t para amostras independentes (no Minitab: \u201cEstat\\ Estat\u00edsticas B\u00e1sicas\\ Teste t para 2 Amostras\u201d) d\u00e1 o valor t = 1,27 e p-valor = 0,110. Como o p-valor > 0,05, isto indicaria que n\u00e3o h\u00e1 evidencias de diferen\u00e7as significantes entre os dois tipos de t\u00eanis e esta conclus\u00e3o seria errada!<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 2 \u2013 Estrat\u00e9gia de an\u00e1lise do experimento dos t\u00eanis: amostras emparelhadas<\/p>\n <\/p>\n <\/p>\n \u00a0 Como se explicam esses resultados aparentemente conflitantes? Na Figura 3a ilustrou-se o enfoque correto para este experimento que seria observar para cada menino a diferen\u00e7a entre os dois t\u00eanis: a reta tracejada horizontal representa a m\u00e9dia das diferen\u00e7as e a barra vertical \u00e0 esquerda do gr\u00e1fico na altura do primeiro menino representa o intervalo de confian\u00e7a de 95% para esta diferen\u00e7a m\u00e9dia. Como o valor zero (n\u00e3o diferen\u00e7a entre os t\u00eanis) est\u00e1 longe do intervalo de confian\u00e7a, podemos inferir que h\u00e1 diferen\u00e7a significante entre as m\u00e9dias. Na Figura 3b ilustrou-se o \u201cenfoque de amostras independentes\u201d: neste caso a diferen\u00e7a entre as m\u00e9dias parece pequena quando se compara com a largura dos intervalos de confian\u00e7a (os intervalos em torno de cada m\u00e9dia t\u00eam uma grande parte sobreposta).<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 3 \u2013 An\u00e1lise de um experimento com amostras emparelhadas ou com amostras independentes<\/p>\n <\/p>\n <\/p>\n \u00a0 No enfoque de amostras emparelhadas, ao se trabalhar com as diferen\u00e7as, elimina-se a diferen\u00e7a entre os meninos. Veja que na Figura 3a as diferen\u00e7as apresentam varia\u00e7\u00e3o aproximada de 2,5 pontos, enquanto que na Figura 3b os valores individuais variam em torno de 8 pontos! Isso explica a diferen\u00e7a entre os m\u00e9todos.<\/p>\n <\/p>\n <\/p>\n Caso 2<\/strong>: <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 4 \u2013 A diferen\u00e7a entre equipamentos \u00e9 avaliada realizando os testes com os mesmos telefones nos dois equipamentos<\/p>\n <\/p>\n <\/p>\n \u00a0 Suponha que num experimento parecido ao da Figura 4, tenham sido analisados 35 telefones (os resultados do teste est\u00e3o na Tabela 2). As hip\u00f3teses de interesse referentes aos dois equipamentos seriam verificar se eles s\u00e3o iguais em rela\u00e7\u00e3o \u00e0s m\u00e9dias e em rela\u00e7\u00e3o \u00e0s varia\u00e7\u00f5es, ou seja:<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Tabela 2 \u2013 Dados observados no experimento dos telefones<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n \u00a0 O teste de diferen\u00e7a entre as m\u00e9dias pode ser feito facilmente no Minitab (\u201cEstat\\ Estat\u00edsticas B\u00e1sicas\\ Teste t pareado\u201d), como j\u00e1 apresentado no exemplo dos t\u00eanis e foi representado na Figura 5. Conclui-se que n\u00e3o h\u00e1 diferen\u00e7a significante entre as m\u00e9dias.<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 5 \u2013 Resultados do teste t para amostras emparelhadas<\/p>\n <\/p>\n <\/p>\n \u00a0 O Minitab n\u00e3o tem o teste de igualdade de vari\u00e2ncias para amostras emparelhadas. A solu\u00e7\u00e3o a este problema afortunadamente j\u00e1 foi encontrada. Histo DOE achou o procedimento em um artigo de Morgan (1939) e n\u00e3o \u00e9 dif\u00edcil de implementar. Os passos s\u00e3o descritos a seguir.<\/p>\n <\/p>\n <\/p>\n \u00a0 Crie duas novas vari\u00e1veis z1 = (A+B)\/2 e z2 = (A-B)\/2. O teste da hip\u00f3tese H0:\u00a0\uf073A =\u00a0\uf073B \u00e9 equivalente ao teste da hip\u00f3tese de inexist\u00eancia de correla\u00e7\u00e3o entre z1 e z2 (H0:\u00a0\uf072z1,z2 = 0). Este teste sim pode ser feito no Minitab, usando o procedimento \u201cEstat\\ Estat\u00edsticas B\u00e1sicas\\ Correla\u00e7\u00e3o\u201d. O teste apresentou resultado significante (p-valor = 0,000), indicando a exist\u00eancia de correla\u00e7\u00e3o entre z1 e z2, o que nos mostra uma forte evid\u00eancia de diferen\u00e7a entre os desvios padr\u00e3o dos dois sistemas. A conclus\u00e3o \u00e9 que os equipamentos t\u00eam a mesma m\u00e9dia, mas n\u00e3o a mesma variabilidade. O desvio padr\u00e3o para os resultados do primeiro equipamento foi 1,2 e para o segundo 1,6.<\/p>\n <\/p>\n <\/p>\n \u00a0 Se Histo DOE tivesse realizado, incorretamente, o teste de duas vari\u00e2ncias independentes do Minitab (\u201cEstat\\ Estat\u00edsticas B\u00e1sicas\\ Teste para 2 Vari\u00e2ncias\u201d) o resultado do p-valor teria sido de 0,169 e Histo DOE concluiria que a diferen\u00e7a entre as variabilidades dos dois aparelhos n\u00e3o era significante.<\/p>\n <\/p>\n <\/p>\n Caso 3<\/strong>: <\/p>\n <\/p>\n Tabela 1 \u2013 Dados de Umidade On-line e Laborat\u00f3rio (Rhodia)<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Tabela 2 \u2013 Dados de uma propriedade On-line e Laborat\u00f3rio (empresa X)<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n \u00a0 Os gr\u00e1ficos das medidas obtidos nos dois exemplos est\u00e3o na Figura 6. Na parte superior dos gr\u00e1ficos est\u00e3o os resultados dos testes de compara\u00e7\u00e3o de m\u00e9dias e vari\u00e2ncias (amostras emparelhadas). Nas duas situa\u00e7\u00f5es n\u00e3o encontramos evid\u00eancias de diferen\u00e7as entre as m\u00e9dias nem entre as vari\u00e2ncias dos dois m\u00e9todos (p-valor > 0,05).<\/p>\n <\/p>\n <\/p>\n \u00a0 No exemplo da empresa X a correla\u00e7\u00e3o entre os dois sistemas de medi\u00e7\u00e3o \u00e9 muito boa, mas o mesmo n\u00e3o acontece no caso da Rhodia. Por outro lado observe que a faixa de valores experimentais utilizados na empresa X \u00e9 muito maior que a largura de especifica\u00e7\u00e3o (representada pelo tamanho da linha vertical = T). Na Rhodia as amostras n\u00e3o apresentaram grande varia\u00e7\u00e3o da propriedade em estudo. Daqui se destaca uma observa\u00e7\u00e3o importante: \u201cquando se trabalha com dados experimentais e deseja-se obter uma equa\u00e7\u00e3o que represente bem a rela\u00e7\u00e3o y = f(x), a faixa de varia\u00e7\u00e3o do \u201dx\u201d deve ser a maior poss\u00edvel. Caso contr\u00e1rio a correla\u00e7\u00e3o pode ficar mascarada pela variabilidade da medi\u00e7\u00e3o.<\/p>\n <\/p>\n <\/p>\n <\/p>\n <\/p>\n Figura 6 \u2013 Experimentos emparelhados para analisar correspond\u00eancia entre an\u00e1lise on-line e laborat\u00f3rio<\/p>\n <\/p>\n <\/p>\n \u00a0 H\u00e1 outros conceitos que podem ser considerados nestes dois conjuntos de dados, tais como \u201cprecis\u00e3o do sistema de medi\u00e7\u00e3o\u201d e \u201clinearidade de exatid\u00e3o\u201d, mas isso poder\u00e1 ser assunto de outros artigos!<\/p>\n <\/p>\n <\/p>\n Conclus\u00f5es:<\/strong><\/p>\n <\/p>\n <\/p>\n \u00a0 Os experimentos emparelhados podem ser bastante \u00fateis para aumentar a efici\u00eancia dos ensaios. Esta estrat\u00e9gia \u00e9 adequada quando se podem formar blocos em fun\u00e7\u00e3o de algum crit\u00e9rio e realizar medidas sob as duas condi\u00e7\u00f5es diferentes dentro de cada bloco. No exemplo dos t\u00eanis, cada menino formava um bloco e as duas condi\u00e7\u00f5es estavam representadas pelos dois tipos de t\u00eanis, um em cada p\u00e9. No exemplo dos equipamentos de teste, cada bloco era um telefone e as condi\u00e7\u00f5es eram os dois equipamentos.<\/p>\n <\/p>\n <\/p>\n \u00a0 Os exemplos mostraram que a estrat\u00e9gia pode ser utilizada para tratar diferentes problemas. Somente devemos tomar o cuidado de utilizar as t\u00e9cnicas de an\u00e1lise adequadas. Lembram o resultado dos casos 1 e 2 quando utilizamos os testes sem considerar que as amostras eram emparelhadas?<\/p>\n <\/p>\n <\/p>\n Refer\u00eancia bibliogr\u00e1fica<\/strong><\/p>\n <\/p>\n <\/p>\n Morgan, W. A. (1939) “A test for the significance of the difference between the two variances in a sample from a normal bivariate population”, Biometrika, vol. 31, p. 13-19.<\/p>\n Carlos Domenech – MBB<\/b><\/p>\n \u00a0<\/p>\n Em 50 palavras ou menos<\/b><\/p>\n \u00a0<\/b><\/p>\n \u00a0<\/b><\/p>\n\n
<\/figure>\n
\u00a0 \u00c9 durante a etapa Analisar que Histo DOE se deparou com o problema do desgaste da sola dos t\u00eanis. Ele decidiu fazer o experimento com amostras emparelhadas. Os resultados do teste dos t\u00eanis est\u00e3o na Tabela 1. A an\u00e1lise deste exemplo poderia ser formulada como na Figura 2.<\/p>\n<\/figure>\n
<\/figure>\n
<\/figure>\n
\u00a0 Outra aplica\u00e7\u00e3o est\u00e1 representada na Figura 4. H\u00e1 dois equipamentos que testam os mesmos aparelhos. Para avaliar se os dois equipamentos apresentam o mesmo n\u00edvel m\u00e9dio e a mesma variabilidade, os mesmos aparelhos poderiam ser testados nos dois equipamentos.<\/p>\n<\/figure>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
\u00a0 Neste caso mostramos duas aplica\u00e7\u00f5es do mesmo tipo de experimento. Uma destas aplica\u00e7\u00f5es foi realizada na Rhodia Poliamida e Especialidades (agradecemos a colabora\u00e7\u00e3o dos Srs. Andr\u00e9 Anderson e Roberto Wagner dos Reis) e a outra na empresa que chamaremos X. Nas duas aplica\u00e7\u00f5es, diversas amostras foram analisadas no laborat\u00f3rio e com analisadores on-line para estabelecer a correspond\u00eancia dos dois m\u00e9todos. Os dados utilizados para a Rhodia est\u00e3o na Tabela 1 e para a empresa X na Tabela 2.<\/p>\n<\/figure>\n
<\/figure>\n
<\/figure>\n