Saber Profundo – Contribuição dos xs
- Durante a etapa Analisar do DMAIC o Belt usualmente deseja determinar a % de contribuição dos xs sobre certo y
- Isto é fácil quando se trabalha com dados experimentais balanceados, não assim quando dispomos de dados históricos
- Neste caso pode-se usar o critério de Taguchi simulando dados balanceados
O “Histo DOE” é um Master Black Belt que gosta muito do LSS, do pensamento crítico, do pensamento estatístico e do estabelecimento de metas “BHAGs” (Big, Hairy, Audacious Goals, metas grandes, cabeludas e audaciosas) na notação de James Collins (Feitas para durar, 2007). Ele procura o Saber Profundo do Dr. Deming.
Neste artigo da série “Saber Profundo” tratamos do seguinte problema. Imagine o processo de uma indústria metalúrgica da Figura 1 com três variáveis de entrada e uma de saída. Como determinar quais são as variáveis xs que têm efeito sobre y, além do tamanho dessa contribuição? O Belt desavisado responderá prontamente: “isso é bico, uso regressão múltipla e determino a contribuição usando a tabela ANOVA!”. Veremos que há solução para o problema, mas que não é tão simples assim. É bom simplificar, conforme mencionamos em um artigo da série, mas a simplificação sem saber profundo pode ser desastrosa! Este artigo foi motivado por um questionamento de um grande amigo, Wendell Lima da empresa Kinross.
Algumas questões para que você pense antecipadamente:
a) Posso determinar a contribuição com dados históricos, normalmente desbalanceados?
b) Como faço isto no Minitab?
c) Para determinar de forma apropriada essa contribuição é melhor que os xs estejam sob controle? Ou não?
d) Uma vez que determino as contribuições dos xs, posso usar esta informação para escolher especificações realísticas dos xs?
Neste artigo tratamos das questões a) a c). Deixamos a questão d) para outra oportunidade.
Descrição do método
A tabela 1 tem uma visão parcial de dados históricos relacionados com a Figura 1 (n = 3792 dados).
Tabela 1 – Visão parcial dos dados utilizados no artigo (ilustração na Figura 1). Dados de jan a dez/2010
Data | x1=Teor A | x2=Teor B | x3=Teor C | Rendimento |
1/1/2010 0:00 | 1,10 | 0,12 | 62,43 | 89,26 |
1/1/2010 2:00 | 1,07 | 0,12 | 53,09 | 89,26 |
1/1/2010 4:00 | 1,04 | 0,09 | 57,02 | 91,49 |
1/1/2010 6:00 | 0,87 | 0,09 | 36,99 | 89,37 |
1/1/2010 8:00 | 0,76 | 0,06 | 56,19 | 91,91 |
1/1/2010 10:00 | 0,84 | 0,07 | 59,17 | 92,09 |
1/1/2010 12:00 | 0,67 | 0,09 | 57,00 | 86,49 |
1/1/2010 14:00 | 0,92 | 0,08 | 55,11 | 91,09 |
1/1/2010 16:00 | 1,22 | 0,16 | 62,12 | 86,95 |
2/1/2010 2:00 | 1,03 | 0,17 | 67,14 | 83,80 |
2/1/2010 4:00 | 1,21 | 0,16 | 52,49 | 86,72 |
2/1/2010 6:00 | 1,19 | 0,19 | 47,78 | 84,04 |
2/1/2010 8:00 | 0,95 | 0,14 | 42,72 | 85,69 |
2/1/2010 10:00 | 1,06 | 0,13 | 51,34 | 88,05 |
2/1/2010 12:00 | 1,39 | 0,23 | 38,51 | 83,95 |
2/1/2010 14:00 | 0,85 | 0,14 | 59,17 | 83,96 |
2/1/2010 16:00 | 0,94 | 0,10 | 44,00 | 88,99 |
2/1/2010 18:00 | 1,08 | 0,12 | 56,93 | 89,44 |
2/1/2010 20:00 | 1,22 | 0,13 | 66,24 | 89,76 |
2/1/2010 22:00 | 0,95 | 0,12 | 65,82 | 87,91 |
3/1/2010 0:00 | 1,01 | 0,18 | 60,97 | 82,42 |
3/1/2010 2:00 | 1,06 | 0,18 | 56,22 | 83,19 |
3/1/2010 4:00 | 1,38 | 0,19 | 61,08 | 86,64 |
3/1/2010 6:00 | 1,22 | 0,18 | 59,09 | 85,43 |
3/1/2010 8:00 | 0,92 | 0,17 | 55,17 | 81,93 |
: | : | : | : | : |
A Figura 2 tem um gráfico de dispersão para visualizar valores extremos e relações entre os xs ou entre os xs versus ys (no Minitab Gráfico\ Matriz de Dispersão\ Simples). Há uns poucos valores baixos de Rendimento que podem ser eliminados.
A seguir exploramos o mapa mental da Figura 3. Nesta figura a palavra chave é balanceamento (dos dados). A Figura 4 ilustra os conceitos de plano balanceado e não balanceado. Num plano balanceado os níveis dos fatores se combinam de uma forma equilibrada. Isto somente vai acontecer em estudos experimentais ou estudos de fontes de variação (tipo RR).
Figura 3 – Mapa mental para o cálculo da contribuição de fatores “xs” sobre “y”
Figura 4 – Ilustração de um plano balanceado (tipo DOE) e um plano não balanceado (dados históricos)
O maior problema para determinar a contribuição dos “xs” sobre o “y” aparece quando os dados são desbalanceados. Nesta situação não há uma forma simples de distribuir a variabilidade total do “y” entre os xs para determinar a contribuição de cada um. O mapa mental da Figura 3 sugere que você não use os resultados obtidos com dados históricos diretamente. Você vai obter resultados muito contraditórios usando este enfoque. Explicamos as alternativas da Figura 3 a seguir.
1) Uso de dados históricos
O problema dos dados históricos é o seu desbalanceamento, como foi mencionado previamente. Usando o procedimento de regressão múltipla no Minitab iremos obter resultados diferentes conforme a ordem de entrada das variáveis no modelo. Usaremos o procedimento Minitab Estat\ Regressão\ Regressão\ Ajuste de Modelo de Regressão. Entraremos lá com as variáveis conforme a Figura 5. Adicionamos somente a interação entre x1 e x2 porque já vimos previamente que ela é significativa (p-value < 0,01). O procedimento nos mostra os resultados da Tabela 2. O valor da soma em negrito foi agregado por nós somente para mostrar que a soma da coluna “SQ Aj” não é igual à soma de quadrados total. Por este motivo não é valido determinar a contribuição usando esta coluna. A partir da Tabela 2 se pode determinar a contribuição da seguinte forma (usando a coluna SQ Seq):
Contribuição devida a x1 = (24.944+4916/2)/203.062 = 13,5%
Contribuição devida a x2 = (144.439+4916/2)/203.062 = 72,3%
Contribuição devida a x3 = 3/203.062 = 0,0%
Se determinássemos a contribuição usando a coluna SQ Aj. os valores obtidos seriam:
Contribuição devida a x1 = (6.518+4.916/2)/87.702 = 10,2%
Contribuição devida a x2 = (47.502+4.916/2)/87.702 = 57,0%
Contribuição devida a x3 = 7/87.702 = 0,0%
Tabela 2 – Tabela ANOVA entrando os termos do modelo na ordem da tabela abaixo
Fonte | GL | SQ Seq | SQ (Aj.) |
x1=Teor A | 1 | 24.944,0 | 6.518,0 |
x2=Teor B | 1 | 144.439,0 | 47.502,0 |
x3=Teor C | 1 | 3,0 | 7,0 |
x1=Teor A*x2=Teor B | 1 | 4.916,0 | 4.916,0 |
Erro | 3.787 | 28.759,0 | 28.759,0 |
Total | 3.791 | 203.062,0 | 87.702,0 |
Se mudarmos a ordem de entrada dos termos do modelo na janela “Termos no modelo” do botão “Modelo” do Minitab, os resultados da coluna “SQ Seq” mudam (e podem mudar MUITO). As somas de quadrado da coluna SQ Aj. não mudam, mas esta coluna não deveria ser usada porque a soma de quadrados total não é igual à soma de quadrados total real (= 203.062). Por exemplo, para a ordem de entrada: x1=Teor A*x2=Teor B, x1=Teor A, x3=Teor C, x2=Teor B, os resultados ficam como na Tabela 3. Veja que as contribuições (usando SQ Seq) mudam radicalmente (este fato já é conhecido em estatística):
Contribuição devida a x1 = 61,0% (antes 13,5%)
Contribuição devida a x2 = 24,8% (antes 72,3%)
Contribuição devida a x3 = 0,0% (antes 0,0%).
Tabela 3 – Tabela ANOVA entrando os termos do modelo numa outra ordem
Fonte | GL | SQ Seq | SQ Aj. |
x1=Teor A*x2=Teor B | 1 | 5.825 | 4.916 |
x1=Teor A | 1 | 120.953 | 6.518 |
x3=Teor C | 1 | 24 | 7 |
x2=Teor B | 1 | 47.502 | 47.502 |
Erro | 3787 | 28.759 | 28.759 |
Total | 3791 | 203.062 | 87.702 |
A Figura 6 mostra que se pode obter a contribuição que quiser escolhendo uma ordem adequada de entrada dos termos no modelo. Para comparação foram adicionadas também as contribuições calculadas com a coluna SQ Aj. A contribuição de x1 muda de 5,4% até 71,1% enquanto que a contribuição de x2 muda de 28,9% até 94,6%. Legal, não? Qual você quer?
Figura 6 – As contribuições dos fatores mudam conforme a ordem que eles são introduzidos no modelo
2) Uso de dados balanceados – Escolha do domínio a partir do enfoque Taguchi
O que fazer? Voltemos ao mapa mental da Figura 3. Neste artigo foi escolhido um exemplo para o qual se dispões da equação do Rendimento a partir dos xs, ou seja:
- Ajustamos a equação a partir dos dados históricos, como se não tivéssemos a equação real do fenômeno (é o caso mais comum!). Usamos um plano balanceado em que os níveis dos “xs” são definidos usando um enfoque de Taguchi
- Usamos a equação real e um plano balanceado com níveis definidos pelo enfoque de Taguchi
- Usamos a equação real e um plano balanceado com níveis definidos a partir do histórico (usualmente estes níveis vão possuir um domínio mais largo que o enfoque de Taguchi)
Enfoque de Taguchi para medir a contribuição dos xs
Quando se estima a contribuição de um x sobre y, deseja-se simular o que acontecerá no processo quando esta variável x segue um comportamento estável (Figura 7).
Figura 7 – Três variáveis críticas do processo influenciando a variável y
Há alguns problemas para medir a contribuição dos xs nesta situação:
- Queremos simular um processo estável com distribuição aproximadamente normal de seus xs, mas…
- Também necessitamos um plano balanceado dos valores xs para usar a técnica de ANOVA para calcular a contribuição (Figura 8).
Figura 8 – Plano balanceado para estimar a contribuição dos xs
Como satisfazer ao mesmo tempo estes dois aspectos? A ideia de Taguchi está baseada na seguinte questão: “se o desvio padrão da variável “x” for Sx, como calcular os limites inferior e superior das variáveis xs (para um planejamento do tipo 3k), de forma que o desvio padrão dos xs (nesse plano 3k) seja Sx e a distribuição destes xs se assemelhe a uma distribuição normal?”
Pelo critério de Taguchi (1978) os níveis extremos dos xs são determinados (Figura 9):
Figura 9 – Aplicação do critério de Taguchi através da aplicação de DOE para determinação de tolerâncias dos xs
A Figura 10 tem os histogramas das variáveis x1, x2 e x3 com médias e desvios padrão. A partir destes valores médios e desvios padrão foram determinados os limites do DOE da Tabela 4.
|
|
|
Figura 10 – Histogramas de x1, x2 e x3 com média e desvio padrão
Tabela 4 – Limites para determinar a contribuição dos xs pelo enfoque de Taguchi
Variável | Média aproximada | S aproximado | Sx | Limites utilizados no fatorial 33 |
x1 | 1,2 | 0,46 | 0,0033 | (0,6 ; 1,8) |
x2 | 0,17 | 0,08 | 0,612 | (0,07 ; 0,27) |
x3 | 60 | 9,5 | 0,326 | (48 ; 72) |
A partir destes limites geramos um fatorial 33 e obtivemos os valores do Rendimento usando a equação do Rendimento (ver Tabela 5). Usamos agora estes valores para ajustar o modelo de regressão múltipla com o procedimento Estat\ Regressa\ Regressão\ Ajuste de Modelo de Regressão. A Tabela 6 tem os resultados da ANOVA a partir da qual se podem obter as contribuições dos xs (para que o Minitab calcule a contribuição escolha no botão “Resultados” do procedimento de regressão “Exibição dos resultados = Tabelas Expandidas):
- Contribuição devida a x1 = 40,6%
- Contribuição devida a x2 = 45,8%
- Contribuição devida a x3 = 0,0%
- Contribuição devida à interação x1 x2 = 9,4%
Estes são os valores “mais corretos” para medir a contribuição dos xs. Neste caso as somas de quadrado da coluna “SQ Seq” serão as mesmas para qualquer ordem de entrada dos termos no modelo (a diferença da situação desbalanceada em que as somas de quadrado variavam conforme a ordem de entrada dos termos do modelo).
A soma das contribuições não é 100% porque parte da variabilidade ficou por conta do erro (parte não explicada pelo modelo). Lembre que embora a equação seja conhecida, e desse modo o erro deveria ser zero, a equação ajustada foi uma equação linear com os termos x1, x2, x3 e x1*x2 (diferente da equação real).
Tabela 5 – DOE com limites de Taguchi e dados gerados pela fórmula conhecida
Ensaios | x1=Teor A | x2=Teor B | x3=Teor C | Rendimento |
1 | 0,6 | 0,07 | 48 | 88,46 |
2 | 0,6 | 0,07 | 60 | 88,44 |
3 | 0,6 | 0,07 | 72 | 88,42 |
4 | 0,6 | 0,17 | 48 | 71,92 |
5 | 0,6 | 0,17 | 60 | 71,87 |
6 | 0,6 | 0,17 | 72 | 71,84 |
7 | 0,6 | 0,27 | 48 | 55,31 |
8 | 0,6 | 0,27 | 60 | 55,25 |
9 | 0,6 | 0,27 | 72 | 55,21 |
10 | 1,2 | 0,07 | 48 | 94,30 |
11 | 1,2 | 0,07 | 60 | 94,28 |
12 | 1,2 | 0,07 | 72 | 94,26 |
13 | 1,2 | 0,17 | 48 | 86,14 |
14 | 1,2 | 0,17 | 60 | 86,08 |
15 | 1,2 | 0,17 | 72 | 86,04 |
16 | 1,2 | 0,27 | 48 | 77,94 |
17 | 1,2 | 0,27 | 60 | 77,85 |
18 | 1,2 | 0,27 | 72 | 77,79 |
19 | 1,8 | 0,07 | 48 | 96,25 |
20 | 1,8 | 0,07 | 60 | 96,22 |
21 | 1,8 | 0,07 | 72 | 96,20 |
22 | 1,8 | 0,17 | 48 | 90,88 |
23 | 1,8 | 0,17 | 60 | 90,81 |
24 | 1,8 | 0,17 | 72 | 90,77 |
25 | 1,8 | 0,27 | 48 | 85,48 |
26 | 1,8 | 0,27 | 60 | 85,38 |
27 | 1,8 | 0,27 | 72 | 85,32 |
Tabela 6 – Resultados da ANOVA com os dados da Tabela 5 (DOE com enfoque de Taguchi e dados da fórmula original)
Fonte | GL | SQ Seq | Contribuição | SQ (Aj.) |
x1=Teor A | 1 | 1617,13 | 40,59% | 0,00 |
x2=Teor B | 1 | 1826,19 | 45,84% | 1161,01 |
x3=Teor C | 1 | 0,04 | 0,00% | 0,04 |
x1=Teor A*x2=Teor B | 1 | 374,72 | 9,41% | 374,72 |
Erro | 22 | 166,00 | 4,17% | 166,00 |
Total | 26 | 3984,07 | 100,00% |
|
3) Uso de dados balanceados – Escolha do domínio a partir do histórico
Uma variante da situação anterior é determinar níveis dos xs (para o DOE) a partir dos valores extremos do histórico (Figura 10). Os níveis usados neste caso estão a seguir e foram bastante mais largos que os usados com o enfoque Taguchi (Tabela 4):
- x1: 0,5 – 2,5
- x2: 0,02 – 0,48
- x3: 30 – 76.
A contribuição dos xs neste caso foi bastante semelhante à obtida com os limites definidos pelo enfoque Taguchi:
- Contribuição devida a x1 = 41,0% (com Taguchi = 45,3%)
- Contribuição devida a x2 = 51,6% (com Taguchi = 50,5%)
- Contribuição devida a x3 = 0,0% (idem Taguchi).
4) Uso de dados históricos para obter o modelo – Escolha do domínio por Taguchi
Os dados históricos (sem valores extremos) foram usados para determinar a equação do modelo. Neste caso estamos assumindo que não conhecemos a equação real do processo e será estimada a partir do histórico (situação mais real que as duas anteriores). O termo x3 ficou no modelo (embora não ser significante, p> 0,05) somente para destacar que sua contribuição é nula.
Análise de Regressão: Rendimento versus x1, x2, x3
Termo Coef EP Coef T P Constante 91,8123 0,3880 236,66 0,000 x1=Teor A 6,5805 0,2246 29,30 0,000 x2=Teor B -119,379 1,509 -79,09 0,000 x3=Teor C -0,004457 0,004758 -0,94 0,349 x1=Teor A*x2=Teor B 27,068 1,064 25,44 0,000
S = 2,75574 R2 = 85,84% R2(aj) = 85,82% |
Esta equação foi usada para obter novamente os valores de Rendimento do DOE da Tabela 5. Neste caso o Rendimento calculado foi diferente ao da Tabela 5 porque não estamos usando a equação real, mas a equação estimada a partir do histórico. A Tabela 7 contém a tabela ANOVA. A partir desta tabela obtivemos as seguintes contribuições:
Contribuição devida a x1 = 36,8%
Contribuição devida a x2 = 61,8
Contribuição devida a x3 = 0,0%.
Tabela 6 – Resultados da ANOVA com DOE Taguchi e Rendimento estimado a partir de fórmula estimada com histórico
Fonte | GL | SQ Seq | SQ Aj. |
x1=Teor A | 1 | 810,25 | 21,05 |
x2=Teor B | 1 | 1359,21 | 1359,21 |
x3=Teor C | 1 | 0,05 | 0,01 |
x1=Teor A*x2=Teor B | 1 | 0 | 0 |
Erro | 22 | 31,65 | 31,65 |
Total | 26 | 2201,16 |
|
Conclusões:
A Figura 11 contém o resumo dos diferentes enfoques. Os enfoques corretos são os obtidos usando plano balanceado.
Se tiver que determinar qual é a contribuição de fatores do seu processo sobre a variável “y” use um plano balanceado. Isto é válido tanto se você obtém os valores de y usando um DOE real ou se você obtém primeiro a equação com dados históricos e depois estima os valores de y usando os níveis de “x” do DOE. Os valores obtidos usando o enfoque DOE são todos bem parecidos entre sim.
Carlos Domenech
Referências:
Taguchi, G. (1978). Performance analysis design. Int. J. Prod. Res. 16 (6) p. 521-530.
Carlos Domenech
Acesse nosso Instagram clicando aqui.