I chatbot basati sull’intelligenza artificiale continuano a mostrare limiti importanti quando si tratta di diagnosi mediche, soprattutto nelle prime fasi di valutazione. Secondo uno studio pubblicato su Jama Network Open e riportato dal Financial Times, questi sistemi sbagliano in più dell’80% dei casi quando le informazioni disponibili sono ancora poche o incomplete.
Il problema principale sui dati iniziali
Il problema principale riguarda proprio la gestione dei dati iniziali: quando i dettagli sul paziente sono scarsi, i modelli tendono a ridurre troppo velocemente le possibili opzioni, puntando su una sola diagnosi invece di mantenere aperto il ventaglio delle ipotesi.
Come spiega Arya Rao, ricercatrice del sistema sanitario Mass General Brigham e prima autrice dello studio, questi strumenti danno il meglio di sé solo in una fase successiva: “Funzionano molto bene quando il quadro clinico è completo e definito, ma fanno fatica nella fase iniziale, quella più incerta, in cui le informazioni sono limitate”.
L’errore nella diagnosi cala nei casi più dettagliati
Non a caso, quando i dati diventano più dettagliati, il tasso di errore cala sensibilmente, scendendo sotto il 40%. Nei casi migliori, i modelli più avanzati arrivano anche a superare il 90% di accuratezza nelle diagnosi finali.
Nonostante questi progressi, lo studio mette in guardia da un uso eccessivo o esclusivo dell’intelligenza artificiale in ambito sanitario. Il rischio è particolarmente alto quando le informazioni inserite dagli utenti sono vaghe, incomplete o poco precise: in questi scenari, affidarsi solo alla tecnologia può portare a valutazioni fuorvianti e potenzialmente pericolose.

