Acesso livre
Acesso livre

VisionFM: uma IA generalista que supera modelos de única modalidade em diagnósticos oftalmológicos

25 Dez, 2024 | 10:56h

O estudo apresenta o VisionFM, um modelo de inteligência artificial desenvolvido para lidar com múltiplas doenças oftalmológicas e diversas modalidades de imagem, incluindo fotografias de fundo de olho, tomografia de coerência óptica (OCT), angiografia, ultrassom e ressonância magnética. A pesquisa surge do desafio de existirem modelos restritos a tarefas ou doenças específicas, que acabam tendo utilidade clínica limitada e pouca adaptabilidade a novas situações. Assim, o objetivo central foi criar e validar um modelo que pudesse diagnosticar, prever e segmentar estruturas oculares, incorporando diferentes tipos de imagens e cenários clínicos.

Para isso, foram utilizados 3,4 milhões de imagens de mais de 500 mil pacientes, abrangendo variadas doenças oculares, dispositivos de imagem e cenários clínicos, em um processo de pré-treinamento profundo. O VisionFM foi então testado em múltiplas aplicações: rastreamento e detecção de doenças, predição de prognósticos, segmentação de lesões e anatomia ocular, além de comparação com oftalmologistas de diferentes níveis de experiência. Os resultados demonstraram desempenho robusto em diagnósticos de doenças como retinopatia diabética, degeneração macular relacionada à idade, glaucoma, catarata, entre outras, com acurácia comparável à de oftalmologistas intermediários.

As conclusões apontam para a utilidade de um modelo que possa agregar diferentes necessidades em oftalmologia, desde a triagem de pacientes até a previsão de evolução clínica, como no glaucoma. Além disso, a flexibilidade do VisionFM permite incorporar dados de novas doenças e modalidades de imagem, possibilitando ampliações futuras sem necessidade de recomeçar o treinamento. Esse tipo de abordagem geral, porém ajustável, pode acelerar a adoção de IA em regiões com escassez de especialistas e apoiar práticas em locais onde a demanda por exames oftalmológicos é crescente.

Na prática clínica, o VisionFM traz potencial para reduzir custos e tempo na triagem de doenças oculares, especialmente em ambientes com poucos recursos. Contudo, é fundamental manter a cautela, pois o diagnóstico médico não se limita a imagens: informações clínicas complementares seguem indispensáveis. Como pontos fortes, destacam-se a abrangência do banco de dados de pré-treinamento e a habilidade de generalização em diferentes cenários. Entre as limitações, há o predomínio de dados provenientes da população chinesa e a necessidade de validação adicional para tarefas mais complexas, como detecção de tumores intracranianos apenas via imagens de fundo de olho. Além disso, alguns biomarcadores sistêmicos ainda exigem estudos maiores para confirmar a viabilidade do uso em rotina clínica.

Para pesquisas futuras, sugere-se ampliar a diversidade demográfica da base de pré-treinamento, validar o modelo em larga escala em outros países e incorporar novas modalidades de imagem e doenças raras. O VisionFM também poderá evoluir com integrações a modelos de linguagem, tornando-se uma ferramenta ainda mais completa no suporte ao diagnóstico.

Referência
Qiu J, Wu J, Wei H, et al. Development and Validation of a Multimodal Multitask Vision Foundation Model for Generalist Ophthalmic Artificial Intelligence. NEJM AI 2024;1(12). DOI: http://doi.org/10.1056/AIoa2300221

 


Mantenha-se atualizado em sua especialidade

 

Escolha quantas especialidades quiser.