Como você descobre correlações de causa e efeito entre dados? O diagrama de dispersão é uma das 7 ferramentas da qualidade que fornece, de maneira direta, uma visualização quantitativa das possíveis relações entre dois dados variáveis.
Este artigo é um guia geral dessa ferramenta, em que você verá:
- O que é e exemplo de diagrama de dispersão;
- Como interpretar os dados de acordo com os tipos de correlação encontrados;
- Quando usar o diagrama de dispersão e sua relação com a Qualidade;
- Limitações dessa ferramenta; e
- Como fazer um diagrama de dispersão.
O que é diagrama de dispersão
Diagrama de dispersão é um gráfico que representa a relação entre duas medidas variáveis para cada elemento de conjunto de dados, a fim de identificar padrões de correlação entre ambas, como causa e efeito. Por isso, o gráfico também é conhecido pelo nome de diagrama de correlação.
Por via de regra, a pergunta que o diagrama responde é: se eu modifico X, o que acontece com Y? Há uma padrão nessa mudança, de modo a determinar que X seja a causa da mudança em Y?
O gráfico é um modelo estatístico, ideal para encontrar variáveis com relação forte entre si, de tal forma que você identifique padrões que possam ser aplicados a casos futuros ou em que você não tem condições de fazer as duas medições.
Para compreender melhor, vejamos um exemplo.
Exemplo de diagrama de dispersão
No diagrama abaixo, relacionamos duas variáveis medidas em um elemento. Notamos que elas seguem um padrão, de modo que se temos que, se X cai, Y aumenta (ver gráfico abaixo).
Isso permite que façamos estimativas sobre ambas as variáveis no futuro. Por exemplo, no caso de termos feito a medição de X em dado momento, podemos esperar que Y siga o mesmo padrão verificado no gráfico.
Vamos aprofundar a interpretação do gráfico de dispersão.
Como interpretar o diagrama de dispersão
Cada ponto de um diagrama de dispersão representa a relação entre dois dados variáveis (X e Y), formando uma nuvem de dados no gráfico.
Essa nuvem pode ter diversos padrões, com diferentes significados. De modo geral, quanto mais dispersos os pontos, menor a correlação entre as variáveis comparadas.
Quanto menos dispersos, maior a tendência de correlação. E então podemos encontrar alguns tipos de correlação, com diferentes interpretações, que veremos abaixo.
Há ainda os chamados outliers, ou seja, pontos totalmente fora de uma curva com correlação forte. Essas quebras ocasionais de padrão precisam ser analisadas caso a caso, pois podem ser desde simples erros de medição até eventos excepcionais.
Vejamos os tipos de correlação:
Correlação negativa
No nosso exemplo (ver acima), vimos que, quando o X é menor, Y é maior. Para dar tangibilidade, imaginemos que:
- X = o tempo de entrega de um produto; e
- Y = a satisfação do cliente.
Então, pelo gráfico, a tendência é de que a satisfação seja maior quanto menor seja o tempo de entrega. Ou seja, é uma correlação negativa.
A depender do nível de dispersão dos pontos, essa correlação pode ser mais forte ou mais fraca. O nível de correlação pode ser calculado por meio de fórmulas matemáticas.
Correlação positiva
Na correlação positiva, temos que quando X aumenta, Y também aumenta, criando um padrão de pontos ascendentes no gráfico.
Da mesma forma, a depender da dispersão, essa correlação também pode ser forte ou fraca.
Correlação nula
A correlação nula é o caso de dispersão total entre os pontos. Não há qualquer correlação evidente entre as variáveis.
Quando usar o diagrama de dispersão
Normalmente, você vai usar o gráfico de dispersão quando quiser validar alguma relação hipotética entre duas variáveis.
No exemplo que usamos para ilustrar o gráfico, partimos da seguinte hipótese: o tempo de entrega influencia a satisfação dos clientes? Tomamos várias avaliações dos clientes e construímos o gráfico, que mostrou que sim. Se não houvesse correlação teríamos visto um gráfico com pontos dispersos.
Poderíamos ter feito a relação com outras variáveis, como: tempo de resposta no atendimento, quantidade de customizações do produto, número de defeitos, etc.
Da mesma forma, o diagrama de dispersão pode ser aplicado para qualquer outra relação que precise ser investigada mais a fundo.
Em alguns casos, essas relações são mais ou menos evidentes. Levantar hipóteses de possíveis relações é um exercício criativo. Mas, mesmo que seu gráfico mostre total dispersão dos pontos, ele é uma validação objetiva, logo uma fonte de aprendizado.
Diagrama de dispersão na Qualidade
O diagrama de dispersão, como uma das ferramentas da qualidade, é muito aproveitado no SGQ.
Ele costuma estar associado a ferramentas como a folha de verificação, 5 porquês e Ishikawa, com o objetivo de verificar e validar a força das correlações entre causas e efeitos entre os dados coletados.
De maneira geral, será interessante usar o diagrama quando você tem um volume considerável de medições ou condições de fazê-las e tem uma hipótese de causalidade para validar.
Limitações do diagrama de dispersão
Embora seja uma ferramenta quantitativa que reveste de objetividade a correlação entre duas variáveis, o diagrama de dispersão só relaciona duas variáveis.
Quando falamos de causas – como a da satisfação do cliente, usada em nosso exemplo –, podemos ter a atuação de várias outras ao mesmo tempo, com diferentes níveis de importância. Vimos no nosso exemplo que o tempo de entrega é condição necessária para a satisfação do cliente, mas talvez não seja causa suficiente.
Isso chama a atenção para a necessidade de aplicar o diagrama de dispersão com diversas causas, a fim de identificar quais são as correlações mais fortes. Associar, aqui, o diagrama de Pareto pode ser interessante.
Outra limitação é do diagrama – e de certa forma mais difícil de identificar – é que a existência de relação entre duas variáveis nem sempre implica correlação de causa e efeito entre elas.
Da mesma forma, pode acontecer de o diagrama de dispersão não revelar correlação, e ela de fato existir.
Estratificar os dados é fundamental para minimizar essas limitações.
Como fazer diagrama de dispersão
O diagrama de dispersão é feito facilmente obtido em softwares como o Excel e o Google Sheets, que têm modelos prontos.
Você só precisa inserir os dados de cada uma das duas variáveis em colunas e, depois, selecionar a exibição em um diagrama de dispersão.
Diagrama de dispersão: revele correlações
Descobrir correlações entre dados ajuda a organização a descobrir as causas de eventos e, posteriormente, a fazer estimativas com precisão.
O diagrama de dispersão é uma ferramenta simples e que proporciona essa visibilidade.
Você usa essa ferramenta na sua empresa? E no SGQ?
Conte para nós nos comentários. E se tiver dúvidas, fique à vontade para perguntar!