Acabar com a confusão entre correlação e causa 

Aqui está um petisco histórico que você pode não estar ciente. Entre os anos 1860 e 1940, à medida que o número de ministros metodistas residentes na Nova Inglaterra aumentava, também aumentava a quantidade de rum cubano importada para Boston - e ambos aumentavam de maneira extremamente semelhante. Assim, ministros metodistas devem ter comprado muito rum nesse período de tempo!

Na verdade não, essa é uma conclusão tola para desenhar. O que realmente está acontecendo é que ambas as quantidades - ministros metodistas e rum cubano - foram levadas para cima por outros fatores, como o crescimento da população.

Ao chegar a essa conclusão incorreta, cometemos o erro muito comum de correlação confuso com o nexo de causalidade.

Qual é a diferença?

Duas quantidades são ditas correlacionados  se ambos aumentam e diminuem juntos (“positivamente correlacionados”), ou se um aumenta quando o outro diminui e vice-versa (“negativamente correlacionado”).

Correlação é facilmente detectada através de medições estatísticas da Coeficiente de correlação de Pearson, que indica quão firmemente unidas as duas grandezas são, variando de -1 (correlacionado perfeitamente negativamente) através de 0 (não de todo correlacionado) e até 1 (perfeitamente correlacionado positivamente).


innerself assinar gráfico


 causation1tylervigen.com

Mas só porque duas quantidades estão correlacionadas não significa necessariamente que uma é diretamente causando o outro para mudar. Correlação não implica em causa, assim como o tempo nublado não implica chuva, mesmo que o inverso seja verdadeiro.

Se duas quantidades estão correlacionadas, então pode haver uma relação genuína de causa e efeito (como níveis de chuva e vendas de guarda-chuva), mas talvez outras variáveis ​​estejam dirigindo ambas (como números de piratas e aquecimento global), ou talvez seja apenas coincidência (como Consumo de queijo dos EUA e estrangulamentos por lençol).

Mesmo onde a causalidade está presente, devemos ter cuidado para não misturar a causa com o efeito, ou então podemos concluir, por exemplo, que um aumento do uso de aquecedores faz com que o tempo mais frio.

A fim de estabelecer causa e efeito, é preciso ir além das estatísticas e procurar evidências separado (de natureza científica ou histórica) e raciocínio lógico. Correlação pode levar-nos a ir à procura de tais evidências, em primeiro lugar, mas é de nenhuma maneira uma prova em seu próprio direito.

Questões sutis

Embora os exemplos acima foram, obviamente, bobo, correlação é muitas vezes confundida com a causação de maneiras que não são imediatamente óbvios no mundo real. Ao ler e interpretar as estatísticas, deve-se tomar muito cuidado para entender exatamente o que os dados e as estatísticas são o que implica - e mais importante, o que são não implicando.

 causation2

Um exemplo recente da necessidade de cautela na interpretação dos dados é a emoção no início deste ano em torno do inovador aparente detecção de ondas gravitacionais - um anúncio que parece ter sido feito prematuramente, antes que todas as variáveis ​​que estavam afetando os dados fossem contabilizadas.

Infelizmente, analisando estatísticas, probabilidades e riscos não é um conjunto de habilidades com fio em nosso intuição humanae assim é muito fácil ser desviado. Livros inteiros foram escritos sobre as maneiras sutis pelas quais as estatísticas podem ser mal interpretadas (ou usadas para enganar). Para ajudar a manter a sua guarda, aqui estão alguns problemas estatísticos escorregadios comuns que você deve estar ciente:

1) O Efeito Trabalhador Saudável, onde às vezes dois grupos não podem ser comparados diretamente em um campo de jogo nivelado.

Considere um estudo hipotético comparando a saúde de um grupo de trabalhadores de escritório com a saúde de um grupo de astronautas. Se o estudo não mostrar nenhuma diferença significativa entre os dois - não há correlação entre a saúde e o ambiente de trabalho - devemos concluir que viver e trabalhar no espaço não traz riscos de longo prazo para a saúde dos astronautas?

Não! Os grupos não estão no mesmo patamar: o corpo de astronautas seleciona os candidatos para encontrar candidatos saudáveis, que então mantêm um regime abrangente de condicionamento físico para combater proativamente os efeitos de viver em “microgravidade”.

Esperamos, portanto, que sejam, em média, significativamente mais saudáveis ​​do que os trabalhadores de escritório e, com razão, deveriam estar preocupados se não estivessem.

2) Categorização e Efeito da Migração do Estágio - embaralhar pessoas entre grupos pode ter efeitos dramáticos nos resultados estatísticos.

Isso também é conhecido como Will Rogers efeito, após o comediante norte-americano que supostamente brincou:

Quando os Okies deixou Oklahoma e se mudou para a Califórnia, eles levantaram o nível médio de inteligência em ambos os estados.

Para ilustrar, imagine dividir um grande grupo de amigos em um grupo “curto” e um grupo “alto” (talvez para organizá-los para uma foto). Tendo feito isso, é surpreendentemente fácil aumentar a altura média de ambos os grupos ao mesmo tempo.

Simplesmente peça à pessoa mais baixa do grupo “alto” para passar para o grupo “curto”. O grupo “alto” perde seu membro mais curto, aumentando assim sua altura média - mas o grupo “curto” ganha seu membro mais alto ainda, e assim também ganha em estatura média.

Isso tem implicações importantes nos estudos médicos, nos quais os pacientes geralmente são classificados em grupos “saudáveis” ou “não saudáveis” durante o teste de um novo tratamento. Se os métodos diagnósticos melhorarem, alguns pacientes muito pouco saudáveis ​​podem ser reclassificados - levando os resultados de saúde de ambos os grupos a melhorar, independentemente da eficácia (ou não) do tratamento.

 causation3Escolher e escolher entre os dados pode levar a conclusões erradas. Os céticos vêem o período de resfriamento (azul) quando os dados realmente mostram um aquecimento de longo prazo (verde). skepticalscience.com 

mineração 3) de dados - quando uma abundância de dados está presente, pedaços e peças podem ser de cereja escolhidos para suportar qualquer conclusão desejada.

Esta é uma prática estatística ruim, mas se feito deliberadamente pode ser difícil de detectar sem o conhecimento do conjunto de dados original e completo.

Considere o gráfico acima, mostrando duas interpretações dos dados do aquecimento global, por exemplo. Ou fluoreto - em pequenas quantidades, é um dos medicamentos preventivos mais eficazes da história, mas o efeito positivo desaparece inteiramente se considerarmos apenas quantidades tóxicas de flúor.

Por razões semelhantes, é importante que os procedimentos para um dado experimento estatístico sejam fixados antes que o experimento comece e então permaneça inalterado até o término do experimento.

4) Clustering - o que é esperado mesmo em dados completamente aleatórios.

Considere um estudo médico examinando como uma doença em particular, como câncer ou esclerose múltipla, é distribuído geograficamente. Se a doença ocorrer de forma aleatória (e o ambiente não tiver efeito), esperamos ver numerosos grupos de pacientes, como é óbvio. Se os pacientes se espalharem de maneira uniforme, a distribuição seria muito imprevisível!

Portanto, a presença de um único cluster, ou um número de pequenos grupos de casos, é inteiramente normal. São necessários métodos estatísticos sofisticados para determinar quanto cluster é necessário para deduzir que algo nessa área pode estar causando a doença.

Infelizmente, qualquer cluster em todos - mesmo um não significativo - faz para um fácil (e à primeira vista, convincente) manchete de notícias.

 causation4

A análise estatística, como qualquer outra ferramenta poderosa, deve ser usada com muito cuidado - e, em particular, deve-se sempre ter cuidado ao tirar conclusões com base no fato de que duas quantidades estão correlacionadas.

Em vez disso, devemos sempre insistir em evidências separadas para argumentar por causa e efeito - e essa evidência não virá na forma de um único número estatístico.

Correlações aparentemente convincentes, digamos, entre determinados genes e esquizofrenia ou um entre dieta rica em gordura e doenças cardíacas, podem se basear em metodologias muito duvidosas.

Nós somos talvez como uma espécie cognitivamente mal preparada para lidar com essas questões. Como educador canadense Kieran Egan coloque em seu livro Obtendo errado desde o início:

A má notícia é que nossa evolução nos equipou para viver em sociedades pequenas, estáveis ​​e caçadoras-coletoras. Nós somos pessoas do Pleistoceno, mas nossos cérebros linguísticos criaram sociedades massivas, multiculturais, tecnologicamente sofisticadas e em rápida transformação para nós vivermos.

Em consequência, devemos constantemente resistir à tentação de ver significado no acaso e confundir correlação e causação.A Conversação

Este artigo foi originalmente publicado em A Conversação
Leia a artigo original.


Sobre os autores

Borwein jonathanJonathan Borwein (Jon) é Professor Laureado de Matemática na Universidade de Newcastle. Ele é Professor Laureado de Matemática na Universidade de Newcastle e Diretor do Centro de Matemática de Pesquisa Assistida por Computador e suas Aplicações (CARMA). Trabalhou nas universidades Carnegie-Melon, Dalhousie, Simon Fraser e Waterloo e ocupou duas cadeiras de pesquisa no Canadá em computação.

rosa michaelMichael Rose é PhD Candidate, Faculdade de Ciências Matemáticas e Físicas da Universidade de Newcastle. Estudante de PhD em matemática sob a supervisão do Prof. Laureate Jon Borwein da Universidade de Newcastle, Austrália. Atualmente auxiliando na pesquisa sobre a aplicação da matemática fractal na modelagem de distribuições de sinapses cerebrais.

Declaração de Divulgação: Os autores não trabalham para, consultam, possuem ações ou recebem financiamento de qualquer empresa ou organização que se beneficiaria com este artigo. Eles também não têm afiliações relevantes.


Livro recomendado:

Dinheiro, Sexo, Guerra, Karma: Notas para uma revolução budista
por David R. Loy.

Dinheiro, Sexo, Guerra, Karma: Notas para uma revolução budista por David R. Loy.David Loy tornou-se um dos mais poderosos defensores da cosmovisão budista, explicando como ninguém a sua capacidade de transformar a paisagem sociopolítica do mundo moderno. Dentro Dinheiro, Sexo, Guerra, Karma, ele oferece apresentações nítidas e até mesmo chocantemente claras de grampos budistas frequentemente incompreendidos - o funcionamento do carma, a natureza do eu, as causas do problema tanto no nível individual quanto social - e as verdadeiras razões por trás do nosso senso coletivo de "nunca o suficiente "seja tempo, dinheiro, sexo, segurança ... até guerra. A "Revolução Budista" de David é nada menos que uma mudança radical nas maneiras pelas quais podemos abordar nossas vidas, nosso planeta, as ilusões coletivas que permeiam nossa língua, cultura e até mesmo nossa espiritualidade.

Clique aqui para mais informações e / ou para encomendar este livro na Amazon.