Paradoxos de probabilidade e outras estranhezas estatísticas

Crédito da imagem: agsandrew via Shutterstock

Você não precisa esperar muito para ver uma manchete proclamando que algum alimento ou comportamento está associado a um aumento ou diminuição do risco à saúde, ou frequentemente a ambos. Como pode ser que estudos científicos aparentemente rigorosos possam produzir conclusões opostas?

Hoje em dia, os pesquisadores podem acessar uma grande variedade de pacotes de software que podem facilmente analisar dados e gerar os resultados de testes estatísticos complexos. Embora sejam recursos poderosos, eles também abrem a porta para que pessoas sem um entendimento estatístico completo não entendam algumas das sutilezas de um conjunto de dados e tirem conclusões totalmente incorretas.

Aqui estão algumas falácias e paradoxos estatísticos comuns e como eles podem levar a resultados que são contra-intuitivos e, em muitos casos, simplesmente errados.

PARADOXO DE SIMPSON

É aqui que as tendências que aparecem em grupos diferentes desaparecem quando os dados desses grupos são combinados. Quando isso acontece, a tendência geral pode até parecer o oposto das tendências em cada grupo.

Um exemplo desse paradoxo é onde um tratamento pode ser prejudicial para todos os grupos de pacientes, mas pode parecer benéfico em geral, uma vez que os grupos são combinados.

Como acontece?

Isso pode acontecer quando os tamanhos dos grupos são desiguais. Um estudo com seleção descuidada (ou inescrupulosa) do número de pacientes pode concluir que um tratamento prejudicial parece benéfico.

Exemplo

Considere o seguinte ensaio duplo-cego de um tratamento médico proposto. Um grupo de 120 pacientes (divididos em subgrupos de tamanhos 10, 20, 30 e 60) recebe o tratamento e 120 pacientes (divididos em subgrupos de tamanhos correspondentes 60, 30, 20 e 10) não recebem tratamento.

Os resultados gerais fazem parecer que o tratamento foi benéfico para os pacientes, com uma taxa de recuperação maior para os pacientes com o tratamento do que para aqueles sem ele.

Crédito da imagem: The Conversation, CC BY-ND

No entanto, quando você analisa os vários grupos que compunham a coorte no estudo, você vê em todos os grupos de pacientes, a taxa de recuperação foi 50% maior para os pacientes que não tiveram tratamento.

Crédito da imagem: – A conversa, CC BY-ND

Mas observe que o tamanho e a distribuição de idade de cada grupo é diferente entre aqueles que fizeram o tratamento e aqueles que não o fizeram. Isso é o que distorce os números. Nesse caso, o grupo de tratamento está desproporcionalmente empilhado com crianças, cujas taxas de recuperação são geralmente mais altas, com ou sem tratamento.

BASE RATE FALLACY

Essa falácia ocorre quando desconsideramos informações importantes ao fazer um julgamento sobre a probabilidade de algo.

Se, por exemplo, soubermos que alguém adora música, podemos pensar que é mais provável que seja um músico profissional do que um contador. No entanto, existem muito mais contadores do que músicos profissionais. Aqui, negligenciamos que a taxa básica para o número de contadores é muito maior do que o número de músicos, por isso fomos indevidamente influenciados pela informação de que a pessoa gosta de música.

Como acontece?

A falácia da taxa básica ocorre quando a taxa básica de uma opção é substancialmente mais alta do que a de outra.

Exemplo

Considere testar uma condição médica rara, como uma que afeta apenas 4% (1 em 25) da população.

Digamos que haja um teste para a condição, mas não é perfeito. Se alguém tiver a condição, o teste irá identificá-lo corretamente como estando doente cerca de 92% das vezes. Se alguém não tiver a condição, o teste irá identificá-lo corretamente como sendo saudável 75% das vezes.

Portanto, se testarmos um grupo de pessoas e descobrirmos que mais de um quarto delas são diagnosticadas como doentes, podemos esperar que a maioria dessas pessoas realmente tenha a doença. Mas estaríamos errados.

Em uma amostra típica de 300 pacientes, para cada 11 pessoas corretamente identificadas como doentes, outras 72 são incorretamente identificadas como doentes. – Crédito da imagem: The Conversation, CC BY-ND

De acordo com nossos números acima, dos 4% dos pacientes que estão doentes, quase 92% serão diagnosticados corretamente como doentes (ou seja, cerca de 3,67% da população geral). Mas dos 96% dos pacientes que não estão doentes, 25% serão diagnosticados incorretamente como doentes (ou seja, 24% da população geral).

Isso significa que, dos cerca de 27,67% da população diagnosticada como doente, apenas cerca de 3,67% o são. Portanto, das pessoas que foram diagnosticadas como doentes, apenas cerca de 13% (ou seja, 3,67% / 27,67%) realmente não estão bem.

De forma preocupante, quando um famoso estudo pediu aos clínicos gerais para realizarem um cálculo semelhante para informar as pacientes sobre os riscos corretos associados aos resultados da mamografia, apenas 15% deles o fizeram corretamente.

WILL ROGERS PARADOXE

Isso ocorre quando mover algo de um grupo para outro aumenta a média de ambos os grupos, embora nenhum valor realmente aumente.

O nome vem do comediante americano Will Rogers, que brincou que ?quando os Okies deixaram Oklahoma e se mudaram para a Califórnia, eles aumentaram a média de inteligência em ambos os estados?.

O ex-primeiro-ministro da Nova Zelândia, Rob Muldoon, forneceu uma variante local da piada na década de 1980, a respeito da migração de seu país para a Austrália.

Como acontece?

Quando um ponto de dados é reclassificado de um grupo para outro, se o ponto estiver abaixo da média do grupo que está saindo, mas acima da média daquele que está entrando, as médias de ambos os grupos aumentarão.

Exemplo

Considere o caso de seis pacientes cuja expectativa de vida (em anos) foi avaliada como sendo 40, 50, 60, 70, 80 e 90.

Os pacientes que têm expectativa de vida de 40 e 50 anos foram diagnosticados com uma condição médica; os outros quatro não. Isso dá uma expectativa de vida média entre pacientes diagnosticados de 45 anos e entre pacientes não diagnosticados de 75 anos.

Se for desenvolvida uma ferramenta de diagnóstico aprimorada que detecte a condição no paciente com expectativa de vida de 60 anos, a média em ambos os grupos aumentará 5 anos.

Crédito da imagem: The Conversation, CC BY-ND

PARADOXO DE BERKSON

O paradoxo de Berkson pode fazer parecer que há uma associação entre duas variáveis independentes quando não há uma.

Como acontece?

Isso acontece quando temos um conjunto com duas variáveis independentes, o que significa que elas devem ser totalmente não relacionadas. Mas se olharmos apenas para um subconjunto de toda a população, pode parecer que há uma tendência negativa entre as duas variáveis.

Isso pode ocorrer quando o subconjunto não é uma amostra imparcial de toda a população. Tem sido freqüentemente citado nas estatísticas médicas. Por exemplo, se os pacientes se apresentarem em uma clínica apenas com a doença A, a doença B ou ambas, mesmo que as duas doenças sejam independentes, uma associação negativa entre elas pode ser observada.

Exemplo

Considere o caso de uma escola que recruta alunos com base na capacidade acadêmica e esportiva. Suponha que essas duas habilidades sejam totalmente independentes uma da outra. Ou seja, em toda a população, um excelente esportista tem tanta probabilidade de ser forte ou fraco academicamente quanto alguém que é ruim no esporte.

Se a escola admite apenas alunos que são excelentes academicamente, excelentes no esporte ou excelentes em ambos, então, dentro deste grupo, parece que a capacidade esportiva está negativamente correlacionada com a capacidade acadêmica.

Para ilustrar, suponha que cada aluno em potencial seja classificado em capacidade acadêmica e esportiva de 1 a 10. Há uma proporção igual de pessoas em cada faixa para cada habilidade. Conhecer a banda de uma pessoa em uma das habilidades não diz nada sobre sua banda provável na outra.

Suponha agora que a escola só admite alunos que estão na faixa 9 ou 10 em pelo menos uma das habilidades.

Se olharmos para toda a população, a classificação acadêmica média do desportista mais fraco e do melhor desportista são iguais (5,5).

No entanto, dentro do conjunto de alunos admitidos, a classificação acadêmica média do esportista de elite ainda é a de toda a população (5,5), mas a classificação acadêmica média do esportista mais fraco é 9,5, implicando erroneamente uma correlação negativa entre as duas habilidades.

Crédito da imagem: The Conversation, CC BY-ND

MULTIPLE COMPARISONS FALLACY

É aqui que tendências inesperadas podem ocorrer por acaso aleatório sozinho em um conjunto de dados com um grande número de variáveis.

Como acontece?

Ao observar muitas variáveis e explorar tendências, é fácil ignorar quantas tendências possíveis você está testando. Por exemplo, com 1.000 variáveis, há quase meio milhão (1.000×999 / 2) pares potenciais de variáveis que podem parecer correlacionados apenas pelo puro acaso.

Embora seja extremamente improvável que cada par pareça dependente, as chances são de que, do meio milhão de pares, alguns pareçam dependentes.

Exemplo

O paradoxo do aniversário é um exemplo clássico da falácia das comparações múltiplas.

Em um grupo de 23 pessoas (supondo que cada um de seus aniversários seja um dia do ano escolhido independentemente, com todos os dias igualmente prováveis), é mais provável que pelo menos duas pessoas do grupo façam aniversário no mesmo dia.

Muitas vezes as pessoas não acreditam nisso, lembrando que é raro encontrar alguém que compartilha seu próprio aniversário. Se você escolher apenas duas pessoas, a chance de elas compartilharem um aniversário é, obviamente, baixa (cerca de 1 em 365, o que é menos de 0,3%).

No entanto, com 23 pessoas, há 253 (23×22 / 2) pares de pessoas que podem ter um aniversário em comum. Portanto, ao observar todo o grupo, você está testando para ver se algum desses 253 pares, cada um dos quais independentemente tem 0,3% de chance de coincidir, realmente corresponde. Essas muitas possibilidades de um par na verdade tornam estatisticamente muito provável o surgimento de correspondências coincidentes.

Para um grupo de apenas 40 pessoas, é quase nove vezes mais provável que haja um aniversário compartilhado do que não.


Publicado em 21/02/2021 13h45

Artigo original: