Pesquisadores treinam algoritmos para calcular probabilidade de infecção por coronavírus a partir de exames de sangue

Ainda em fase de validação, estudo com dados de 235 pacientes com ou sem Covid-19 do Hospital Israelita Albert Einstein usou métodos de inteligência artificial com 'resultado promissor'.

335

Pesquisadores do Hospital Israelita Albert Einstein publicaram nesta semana um estudo mostrando que algoritmos de inteligência artificial foram capazes de calcular, com grau alto de confiabilidade, a probabilidade de um paciente ter ou não Covid-19 a partir dos resultados de um exame de sangue.

Segundo Edson Amaro, médico e superintendente de ciência de dados e analytics do Einstein, ainda é preciso fazer a “validação externa”, ou seja, replicar os testes em outros locais para confirmar os resultados.

O estudo foi financiado pelo Programa de Apoio ao Desenvolvimento Institucional do Sistema Único de Saúde (Proadi-SUS) e publicado em formato “pre print”, ou seja, quando o estudo ainda não passou pela revisão de pares, no repositório medRxiv, que reúne pesquisas na área de ciências da saúde e é mantido por entidades como a Universidade de Yale, nos Estados Unidos.

Máquina treinada para descobrir padrões

A análise usou dados de 235 pacientes atendidos no pronto-socorro do hospital entre 17 e 30 de março deste ano. Todos eles passaram, num período de 24 horas, tanto pela coleta de exame de sangue quanto de uma amostra para a realização do RT-PCR, o teste molecular para a detecção do novo coronavírus, que provoca a Covid-19.

Desses, 102 acabaram recebendo o resultado positivo para o vírus.

Também foram usados cinco algoritmos diferentes que podem ser treinados para aprender a prever cenários a partir de uma série de dados. Nesse caso, os dados de 70% dos pacientes escolhidos aleatoriamente foram usados para treinar os algoritmos para descobrirem possíveis padrões entre os resultados do exame de sangue e o resultado positivo para o teste RT-PCR.

Então, os pesquisadores testaram o aprendizado dos algoritmos usando os dados dos exames de sangue dos demais 30% dos pacientes.

O estudo mostra que os pacientes em que o resultado do teste da Covid-19 foi positivo apresentaram, em geral, uma média mais baixa de leucócitos, linfócitos, monócitos, basófilos e eosinófilos, células presentes no sangue das pessoas e cujo nível pode ser analisado por meio de hemogramas.

Resultado é considerado promissor

Segundo o artigo, dos cinco algoritmos, todos conseguiram um resultado preditor considerado “muito bom”, variando entre 0.842 e 0.847, numa escala que varia entre 0 e 1, onde 1 seria um acerto em 100% das vezes.

Um deles, conhecido como “máquina de vetores de suporte”, foi indicado pelos pesquisadores como o modelo mais eficaz na análise. Segundo o artigo, no conjunto de pacientes em que o algoritmo indicou uma probabilidade de 80% a 100% para o teste positivo para Covid-19, ele acertou em 82% das vezes. Já entre os pacientes em que a probabilidade indicada era de entre 0% e 20%, o algoritmo errou em 12% dos casos.

André Batista, um dos pesquisadores envolvidos no estudo, explica que a opção de treinar os algoritmos na análise do sangue dos pacientes foi escolhida porque os hemogramas “são exames que são coletados de maneira mais fácil, mais ampla, e talvez isso ser usado como um dos pontos de decisão”.

Segundo Batista, que é formado na graduação, mestrado e doutorado em computação, mas atualmente faz seu pós-doutorado na Faculdade de Saúde Pública da Universidade de São Paulo (FSP-USP), as conclusões após a primeira fase de análise são que o estudo “é promissor, os resultados são animadores, as métricas calculadas com todo o rigor indicam isso. E no ‘machine learning’ (aprendizado de máquina, em inglês), quanto mais dados, mais preciso e realista vai ser o modelo”.

Modelos de previsão x cenário real

O artigo traz a ressalva, por exemplo, de que as respostas do aprendizado de máquina podem variar em fases diferentes da doença ou considerando o intervalo de tempo entre o aparecimento dos sintomas e o momento de coleta dos exames.

Amaro explica, ainda que “uma das coisas da validação externa é que agora você tem que fazer a seguinte pergunta: e se ele tiver outra infecção viral?” Segundo ele, será preciso entender se o algoritmo é capaz de diferenciar outras infecções da Covid-19. “No estágio atual a gente não consegue analisar isso”, afirmou o médico.

Ele diz, também, que “a virologia não é tão simples”, já que uma mesma pessoa pode estar infectada por uma associação de mais de um vírus, por exemplo. Por isso é importante considerar o contexto em que os dados do estudo serão utilizados.

Especialista na aplicação da inteligência artificial na área da saúde, o professor Alexandre Chiavegatto, da Faculdade de Saúde Pública da USP, explica que, em um cenário ideal, os governos teriam testes suficientes para todas as pessoas, e poderiam dar o atendimento necessário a todos os pacientes com necessidade de ventilação mecânica ou ambiente de isolamento para evitar contágio.

Mas o cenário real no Brasil e em outras partes do mundo está longe disso, e atualmente não há nem testes nem leitos para todos os doentes, caso a epidemia se dissemine sem medidas de restrição do contágio.

“A minha opinião é que todos devem receber o exame. Mas a estrutura atual brasileira não comporta atualmente. A inteligência artificial pode ajudar caso essa escolha seja necessária”, afirmou Chiavegatto. “A ideia nunca é a inteligência artificial tomar decisões sozinha, mas sempre dando subsídio, apoio, para as decisões dos profissionais de saúde, caso tenham de tomá-las.”