Checagem Racismo

CHECAMOS: pesquisa sobre prevalência étnica de mortes por Covid-19 em distritos de São Paulo é enganosa

“É possível contar um monte de mentiras dizendo só verdades, por isso é preciso tomar muito cuidado com a informação e o jornal que você recebe”, esta era a frase de efeito que encerrava a campanha publicitária feita pela W/Brasil para a Folha de S. Paulo em 1987, que marcou minha infância e, provavelmente, minha forma de consumir informação. Já comentei sobre ela nesta outra checagem, mas o exemplo que trago neste post é dramático.

A ONG Rede Nossa São Paulo publicou um documento em setembro de 2021 intitulado “Covid e as desigualdades em São Paulo”. O documento já começou a ser divulgado amplamente por meios de comunicação como portal G1, da Globo.

Um detalhe importante dos dois textos é que eles não afirmam categoricamente que negros são a maioria das vítimas de mortes por Covid-19 na cidade de São Paulo. Embora ambos destaquem recortes pelos quais isso é indicado de forma dramática, não existe em nenhum dos dois a frase “Negros são a maioria dos mortos na capital de São Paulo”. Esta narrativa é construída, em ambos os textos, sub-repticiamente, através de jogos de palavras e de dados: é possível contar um monte de mentiras dizendo apenas verdades.

Além de destacar na manchete que “Negros morreram quase duas vezes mais de Covid-19 do que brancos no Itaim Bibi em 2021, diz pesquisa”, o texto do G1 informa o seguinte: “A pesquisa mostra que negros morreram mais de Covid-19 mesmo nos bairros mais ricos da capital paulista. E o Itaim Bibi, mesmo sendo considerado uma região de menor vulnerabilidade socioeconômica, apresenta uma diferença entre a proporção da população preta e parda que morreu em decorrência da doença.”

O site destacou com uma animação de “caneta de marcação” o mesmo trecho que negritei, conduzindo o leitor a uma narrativa – falsa – de que os dados do Itaim Bibi sejam uma amostra fidedigna dos demais bairros da cidade. Já na página 6 da tal “pesquisa” está escrito o seguinte:


Análise
Em relação ao recorte por raça/cor, percebemos que este fator tem peso muito diferente a depender da cor da população. Ou seja, em um mesmo distrito, o total de óbitos por Covid-19 em relação ao total de óbitos é proporcionalmente maior se considerarmos apenas o recorte da população preta e parda em comparação com o recorte da população branca. A exemplo do distrito de Itaim Bibi que, mesmo sendo
considerada uma região de menor vulnerabilidade socioeconômica, apresenta uma diferença entre a proporção da população preta e parda que morreu por Covid-19 (47,6%) e a proporção de óbitos da população branca (28,1%) de 1,7 vezes .1

Resumo
● De janeiro a julho de 2021, no distrito de Itaim Bibi, a população negra morreu proporcionalmente 1,7 vezes mais por Covid-19, do que a população branca. Enquanto que, entre a população negra, 47,6% das mortes ocorreram por causa da Covid-19; entre a população branca, foram 28,1%.
● No Cambuci, quase metade das mortes da população negra tiveram como causa a Covid-19; enquanto esse número é de quase três em cada dez, entre a população branca.

1 Este cálculo é feito em relação ao total de óbitos de mesma característica da população.


Não ficou muito claro o cálculo? Deixa eu explicar.

Vamos começar com a informação mais curta e grossa possível: o fato é que brancos são a maioria percentual dos mortos no município de São Paulo: são hoje 64,68% das vítimas contra 22,02% de pardos e 8,55% dos pretos.



Entretanto, a Rede Nossa São Paulo não ficou satisfeita com estes dados e produziu a seguinte metodologia: eles pegaram o percentual de mortos por Covid-19 em cada etnia e confrontaram com o percentual de mortos por qualquer causa em cada etnia. É isto o que se refere o “Este cálculo é feito em relação ao total de óbitos de mesma característica da população” que aparece no documento linkado acima. E não há erro nenhum até aqui. Esta é uma forma de se comparar o risco de cada etnia considerando que as populações não são etnicamente homogêneas.

Realmente, a informação de que 64,68% das vítimas são brancas não diz muita coisa até que saibamos o percentual aproximado de brancos na população de São Paulo, e uma forma aceitável de controle epistemológico foi a usada pela ONG.

Outras formas adequadas seriam a utilização dos censos dos últimos anos ou das PNADs, mas confesso que esta até me pareceu mais rigorosa, já que os critérios utilizados por um médico (o responsável pela declaração de óbito, de onde saem os dados) devem ser os mesmos, seja a morte por Covid-19, câncer, infarto ou atropelamento, suponho. Assim corremos menos risco de comparar alhos (o que os médicos preenchem na certidão de óbito) com bugalhos (o que as pessoas declaram ao funcionário do IBGE quando ele bate na casa delas perguntando a etnia). Parabéns à Rede Nossa São Paulo até aqui.

Então precisamos pegar o percentual de mortes por Covid-19 em cada faixa de etnia e dividir pelo percentual de mortes em geral de cada faixa de etnia e ver se os dados estão batendo nas duas fontes ou se o percentual de pretos e pardos é superior na morte por Covid-19 do que nas causas gerais, que é o que a Rede Nossa São Paulo está divulgando. Vamos ver?



Opa, mas o que temos aqui? A proporção de brancos, pretos e pardos mortos por todas as causas não poderia ser mais semelhantes à de mortos por Covid-19: se os brancos são 64,68% dos mortos por Covid-19 são 64,55 dos mortos por todas as causas, se os pretos são 8,55% são exatamente os mesmos 8,55% dos mortos por todas as causas e se os pardos são 22,02% na tabela que conta apenas as mortes confirmadas por Covid-19 são 22,45% da tabela geral de mortes. As diferenças, quando existem, são insignificantes estatisticamente.

Só que a ONG fez um passo adicional. Como era de interesse dos ativistas vitimizar os “negros” em relação aos brancos, então eles desconsideraram os indígenas, os asiáticos e os ignorados, somaram os pretos com os pardos e chamaram isto de “negros”, calcularam a diferença entre as proporções de “negros” e brancos mortos por Covid-19 (em comparação ao total de mortes em cada grupo) e chamaram a isso de desigualtômetro.

Em resumo: se 30% dos pretos e pardos que morreram este ano morreram de Covid-19 e apenas 25% dos brancos que morreram este ano morreram de Covid-19, está desigual: esta é a lógica por trás dos números do “desigualtômetro”.

COMO A REDE SÃO PAULO CONSEGUIU QUE SEU DESIGUALTÔMETRO APITASSE CONTRA OS “NEGROS”?

Cherry picking é um conhecido método de manipulação estatística que consiste em pinçar na pontinha dos dedos os números de um relatório amplo de dados a fim de construir qualquer narrativa que você deseje pela mera omissão das informações indesejáveis.

Funciona assim: digamos que você seja funcionário do supermercado Zona Sul e esteja encarregado de produzir uma campanha publicitária que prove que o supermercado Pão de Açúcar é muito mais careiro. Para isso, o seu chefe te encomendou que fizesse uma comparação entre os preços das duas redes de varejo que dominam a Zona Sul do Rio de Janeiro: é a partir desta comparação que você vai ter que inventar um jeito de provar aos moradores e frequentadores do Leblon e de Ipanema que o Zona Sul vende mais barato.





Ambas as redes vendem produtos diversos a preços diversos. Naturalmente o leite Moça pode estar mais barato em um enquanto o uísque Ballantines 12 anos está mais barato no outro. Pode ser que o arroz selvagem Tio João de 250 gramas esteja a exatamente o mesmo preço em ambos enquanto o pacote de 400 gramas de cação Buona Pesca esteja mais barato no Zona Sul e o pacote do café Sabor da Fazenda (não comprem: gosto de pneu queimado) Mellitta esteja mais caro.

É também esperado que enquanto alguns preços variem muito, outros fiquem quase na mesma faixa. Pode ser que manteiga Aviação de latinha esteja R$ 13,58 num e R$ 14,05 noutro, enquanto a caixa-brinde da cachaça Santo Grau com três garrafas e três copinhos esteja R$ 94,99 num e R$ 117,99 no outro.

Uma forma honesta de comparar qual dos dois mercados é mais careiro seria fazer uma lista grande, com vários produtos de vários setores e verificar, posteriormente, em quais dos dois mercados aquela compra inteira sairia mais barata. Acontece que você não é pago para ser honesto, você é pago para convencer aos moradores da região de que o Zona Sul tem os melhores preços, esqueceu?

Agora preste bastante atenção à tabela publicada na página 5 do documento produzido pela ONG Rede Nossa São Paulo.



Tá vendo esse 0,99 aí na parte de baixo? Ele indica que em relação a toda a cidade, os negros estão morrendo de Covid-19 até um pouco menos do que seria esperado dada a prevalência étnica dos mortos por qualquer causa (que, repito, foi a forma que a ONG usou para ponderar os dados e quanto a isto me parece que fizeram muito bem).

E estes cinco distritos listados acima? Bem. Estes são cinco distritos onde a prevalência de mortes de pretos e pardos por Covid-19 superou as mortes por causas gerais por grande margem de diferença. Seria, usando a nossa comparação didática com preços de supermercado, os itens que estão muito mais caros no Pão de Açúcar, o mercado que você precisa queimar o filme na propaganda, lembra?

Por que a Nossa Rede São Paulo não publicou a lista inteira? Porque se o tivesse feito ia ter que mostrar que em uma série de distritos os negros estão morrendo menos do que o esperado, e os brancos mais. E esta parte não é legal contar, fazer propaganda pro supermercado rival, não dá, né? Bem, apesar de mulato, eu não torço para os supermercados “Negros são as maiores vítimas” e nem atuo contra a rede “Brancos são as maiores vítimas”. Sou funcionário fiel e dedicado da atacarejo “É preciso parar de fomentar guerra racial com base em dados desonestos, ativistas desgraçados”.

Então na imagem abaixo você pode visualizar os desigualtômetros (que nome tosco, einh Nossa Rede São Paulo?) atualizados para todos os distritos de São Paulo, e para todos os grupos étnicos e também a média de toda a cidade (que mostra que os brancos aparecem até um pouquinho pior que pretos e pardos).

O cálculo foi feito com base na mesma metodologia usada pela ONG, a única diferença reside no período analisado (o meu é mais atualizado e mais completo, visto que estou considerando os dados da data de publicação desta checagem).

As linhas laranjas marcam alguns dos distritos em que pretos e pardos morreram mais que o esperado numa comparação exclusiva com brancos. As linhas azuis-claro indicam alguns dos distritos onde ocorreu o inverso. De fato, qualquer “desigualtômetro” maior que 1 indica que os negros estão em desvantagem, dados os critérios utilizados pela ONG, e se for menor que 1 a desvantagem é contra os brancos. Quer fazer um esforço de verificar um por um dos distritos e ver em quantos os negros estão em desvantagem e em quantos são os brancos? Poizé!

A seção MORTALIDADE indica a razão de BRANCOS e “NEGROS” que morreram de Covid-19 em relação à totalidade dos brancos e “negros” mortos por qualquer causa. O valor numérico do “desigualtômetro” é a razão da coluna “NEGROS” pela coluna BRANCOS.

Vou deixar os dados de base para a imagem abaixo linkados aqui e aqui. Assim você pode refazer os cálculos (e pode me avisar de qualquer erro, que aqui quando tem erro tem errata).



POR QUE NÃO USEI DADOS DE JANEIRO-JULHO, COMO FEZ A ONG? E FARIA GRANDE DIFERENÇA?

Após a publicação da versão original deste texto o seguidor Guido sugeriu nos comentários que a checagem fosse feita com base nos dados de janeiro-julho, do mesmo modo que a ONG.

A primeira questão é que os dados do Tabnet relativos a 2021 não são consolidados. A Rede Nossa São Paulo informa que usou dados atualizados em 19/08/2021. Os números relativos aos meses recentes sofrem constante atualização a medida que as burocracias vão alimentando o sistema.

A liberação do laudo de uma autopsia pode demorar semanas ou meses, por exemplo, retardando a entrada de algumas mortes no sistema. Desta maneira, mesmo que eu fizesse a comparação usando os dados de janeiro-julho, os dados não seriam os mesmos que foram utilizados pelos pesquisadores, ainda que a metodologia de análise seja mantida.

Por exemplo: ao dividir os óbitos em que a indicação de causa registrada da declaração de óbito era a B34.2 (Covid-19) os pesquisadores encontraram um valor de 38%. Fazendo o mesmo cálculo com os dados disponíveis para o período de janeiro-julho hoje eu encontrei 33,31% (13 876/41 656*100). A mais provável explicação para a diferença é a entrada de novas mortes por outras causas nos registros, óbitos que ainda esperavam o laudo de uma autópsia para serem registrados, por exemplo.



De qualquer modo, o cerne da checagem está na ocorrência de cherry picking, e isto é demonstrado suficientemente no print da tabela publicada no próprio estudo onde se vê que, apesar do desigualtômetro geral ser desfavorável aos brancos, os distritos selecionados foram apenas alguns em que os dados eram desfavoráveis aos negros. Refazer o cálculo com base na mesma metodologia para todos os distritos foi um bônus para demonstrar inequivocamente como seria o cenário geral sem cherry picking.







3 comentários

    1. De fato. Acontece que os dados são atualizados diariamente no Tabnet, então pelo Tabnet pelo menos eu já não consigo os dados de julho.

      Talvez eu pudesse baixar a tabela em CSV (nem vi se está disponível, mas geralmente fica) e aí poderia fazer um recorte temporal, excluir os dados mais recentes e trabalhar apenas com os até o mês 07 (com uma trabalheira muito maior, que provavelmente me custaria bem mais do que as três horas que gastei nessa).

      Realmente ficaria mais bonito, mas seria apenas por perfeccionismo, porque o ponto central da análise (o cherry picking cometido pela ONG) é evidente independente da reanálise dos dados.

      Na verdade a própria listagem com dados atualizados que apresento no final foi um bônus: o fato de eles terem listado apenas 5 distritos em que negros iam piores e apresentarem logo a seguir uma média municipal que mostra que no geral os brancos estão em pior situação já demonstra suficientemente a ocorrência cherry picking.

      Mas sim, se eu tivesse os dados de julho seria bonito refazer com exatamente a mesma data deles. Talvez eu consiga baixar o CSV e tirar um tempo para uma nova tabela (agora que já entendi a metodologia que eles usaram, talvez consiga filtrar os dados com mais rapidez, talvez em questão de minutos).

      Curtir

    2. Pois então, acabei de checar aqui e na verdade eu até consigo os dados de até julho através do Tabnet, não precisaria o arquivo CSV, mas pouco ajuda. O fato é que os dados têm, como eu já tinha dito, atualizações diárias, não são dados consolidados.

      Desta forma os números que eles checaram de “janeiro a julho” não são mais o que estão disponíveis hoje para o mesmo período. Por exemplo, ao dividir o total de mortes Cid-10 B34.2 (Covid-19) entre brancos pelo total de mortes por qualquer motivo no mesmo grupo, eles encontraram um razão de 38%. Eu acabei de fazer o mesmo cálculo com base nos dados de até julho e encontrei 33,31% (13876 mortes devido a B34.2 dividido por 41656 por mortes devido a qualquer causa).

      A explicação é quase certamente a introdução de novos casos de mortes por causas gerais (corpos esperando resultado de autopsia, por exemplo) após a data em que eles acessaram os dados. A única forma de refazer o cálculo usando exatamente os mesmos dados que ele seria com eles me passando as tabelas salvas no computador deles, não vai rolar 🙂

      Mas obrigado, vou fazer uma nota explicativa sobre isso no post.

      Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: