Como você descobre correlações de causa e efeito entre dados? O diagrama de dispersão é uma das 7 ferramentas da qualidade que fornece, de maneira direta, uma visualização quantitativa das possíveis relações entre dois dados variáveis. Este artigo é um guia geral dessa ferramenta, em que você verá:
- O que é e exemplo de diagrama de dispersão;
- Como interpretar os dados de acordo com os tipos de correlação encontrados;
- Quando usar o diagrama de dispersão e sua relação com a Qualidade;
- Limitações dessa ferramenta; e
- Como fazer um diagrama de dispersão.
O que é diagrama de dispersão
Diagrama de dispersão é um gráfico que representa a relação entre duas medidas variáveis para cada elemento de conjunto de dados, a fim de identificar padrões de correlação entre ambas, como causa e efeito. Por isso, o gráfico também é conhecido pelo nome de diagrama de correlação. Por via de regra, a pergunta que o diagrama responde é: se eu modifico X, o que acontece com Y? Há uma padrão nessa mudança, de modo a determinar que X seja a causa da mudança em Y? O gráfico é um modelo estatístico, ideal para encontrar variáveis com relação forte entre si, de tal forma que você identifique padrões que possam ser aplicados a casos futuros ou em que você não tem condições de fazer as duas medições. Para compreender melhor, vejamos um exemplo.Exemplo de diagrama de dispersão
No diagrama abaixo, relacionamos duas variáveis medidas em um elemento. Notamos que elas seguem um padrão, de modo que se temos que, se X cai, Y aumenta (ver gráfico abaixo). Isso permite que façamos estimativas sobre ambas as variáveis no futuro. Por exemplo, no caso de termos feito a medição de X em dado momento, podemos esperar que Y siga o mesmo padrão verificado no gráfico. Vamos aprofundar a interpretação do gráfico de dispersão.Como interpretar o diagrama de dispersão
Cada ponto de um diagrama de dispersão representa a relação entre dois dados variáveis (X e Y), formando uma nuvem de dados no gráfico. Essa nuvem pode ter diversos padrões, com diferentes significados. De modo geral, quanto mais dispersos os pontos, menor a correlação entre as variáveis comparadas. Quanto menos dispersos, maior a tendência de correlação. E então podemos encontrar alguns tipos de correlação, com diferentes interpretações, que veremos abaixo. Há ainda os chamados outliers, ou seja, pontos totalmente fora de uma curva com correlação forte. Essas quebras ocasionais de padrão precisam ser analisadas caso a caso, pois podem ser desde simples erros de medição até eventos excepcionais. Vejamos os tipos de correlação:Correlação negativa
No nosso exemplo (ver acima), vimos que, quando o X é menor, Y é maior. Para dar tangibilidade, imaginemos que:- X = o tempo de entrega de um produto; e
- Y = a satisfação do cliente.