Mesmo com os avanços significativos nos modelos de linguagem grande (LLMs), eles ainda enfrentam problemas como alucinações, ou seja, a geração de informações imprecisas. Esse problema pode ser especialmente prejudicial em áreas como a saúde, onde dados incorretos podem ter consequências graves.
A Mayo Clinic, um dos hospitais mais renomados dos Estados Unidos, adotou uma abordagem inovadora para lidar com essa questão. Em vez de depender exclusivamente do método de geração aumentada por recuperação (RAG), a instituição implementou uma técnica que reverte o processo tradicional do RAG.
Essa abordagem permite que os modelos não apenas extraiam informações relevantes, mas também vinculem cada dado ao seu conteúdo original.
Essa técnica tem demonstrado resultados impressionantes, eliminando quase todas as alucinações relacionadas à recuperação de dados em casos de uso não diagnósticos, permitindo sua aplicação em práticas clínicas da Mayo Clinic.
Gerenciamento de Dados com Precisão
Uma das maiores dificuldades no setor de saúde é o gerenciamento de dados. Embora os registros eletrônicos de saúde (EHRs) armazenem enormes quantidades de informações, localizar e estruturar esses dados pode ser um desafio.
A primeira aplicação da Mayo Clinic foi em resumos de alta, documentos que fornecem recomendações pós-tratamento. Esse cenário foi escolhido por ser mais simples, envolvendo extração e resumificação de dados, algo em que os LLMs geralmente têm bom desempenho. Segundo Matthew Callstrom, diretor médico da Mayo para estratégia e presidente do departamento de radiologia, isso facilitou a implementação inicial antes de abordar problemas mais complexos.
Apesar disso, as primeiras iterações do sistema apresentaram erros evidentes, como a idade errada do paciente, demonstrando a necessidade de construir o modelo com cuidado.
Superando Limitações do RAG
Embora o método RAG seja crucial para melhorar a precisão dos LLMs, ele apresenta limitações. Os modelos podem recuperar dados irrelevantes, imprecisos ou de baixa qualidade. Além disso, podem falhar ao identificar informações pertinentes à pergunta original ou gerar respostas fora do formato solicitado.
Para superar esses desafios, a Mayo Clinic combinou o algoritmo de Clustering Using Representatives (CURE) com LLMs e bancos de dados de vetores. O algoritmo CURE organiza os dados em clusters baseados em semelhanças e detecta outliers, ou seja, dados que não se encaixam no padrão geral.
Com essa abordagem, os resumos gerados pelos modelos foram divididos em fatos individuais, que foram comparados com os documentos originais para garantir precisão. Um segundo modelo avaliava a relação causal entre os fatos gerados e suas fontes.
Expansão do Uso de IA
Além de gerar resumos de alta, a Mayo Clinic aplicou a tecnologia para sintetizar novos registros médicos. Informações externas frequentemente vêm em formatos variados, dificultando a análise pelos médicos. Com a ajuda da IA, o processo de classificar e criar uma visão geral do paciente, que antes levava cerca de 90 minutos, agora pode ser concluído em apenas 10 minutos.
Essa eficiência tem gerado grande interesse dentro da Mayo Clinic para expandir o uso da tecnologia, aliviando a carga administrativa dos médicos.
Explorando Novas Aplicações
A equipe de Callstrom também está explorando o uso de IA em áreas mais avançadas. Em parceria com a Cerebras Systems, eles desenvolveram um modelo genômico para prever tratamentos de artrite. Além disso, estão trabalhando com a Microsoft na criação de um codificador de imagens e um modelo de base para imagens médicas.
O objetivo é simplificar a análise de exames, como radiografias de tórax, e fornecer ferramentas auxiliares aos médicos. Por exemplo, a IA pode sugerir onde posicionar tubos endotraqueais ou prever outros indicadores médicos a partir das imagens.
A Mayo Clinic também vê potencial significativo na aplicação da IA em genômica e outras áreas relacionadas, como proteômica. Essas tecnologias podem mapear pacientes com perfis semelhantes para criar tratamentos personalizados.
Para que essas inovações sejam implementadas de maneira eficaz, é necessário validar os modelos em ambientes clínicos. Isso envolve testar conjuntos de dados pequenos antes de expandir os grupos de teste e comparar os resultados com terapias padrão.
Com essas iniciativas, a Mayo Clinic busca transformar o atendimento ao paciente, proporcionando cuidados mais específicos e centrados nas necessidades individuais.