Fundado en 1910

La IA fue capaz de acertar entre el 52,4% y el 75% en cada uno de los pasos que componen la pruebaWikimedia Commons

La inteligencia artificial ChatGPT podría aprobar el examen para ejercer como médico en Estados Unidos

Una investigación consigue demostrar que este sistema logró un porcentaje de aciertos que se acerca al aprobado del USMLE

La inteligencia artificial del momento es sin duda ChatGPT. Este robot virtual es capaz de generar textos tan coherentes que fácilmente podríamos pensar que han sido escritos por seres humanos. Su último logro, tras aprobar exámenes de posgrado en Derecho y Economía realizados por las universidades estadounidenses, ha demostrado que está cerca de pasar las pruebas necesarias para ser médico en Estados Unidos.

Los candidatos que buscan ejercer esta profesión, deben conseguir la licencia médica USMLE, que consta de 376 preguntas. De todas ellas, se eliminaron aquellas que incluían imágenes para así evaluar el rendimiento del sistema de inteligencia artificial diseñado por OpenAI.

En total, se escogieron 350 preguntas, buscando generar una escritura similar a la humana mediante la predicción de secuencias de palabras próximas. Recordemos que este chatbot no puede realizar búsquedas en internet y, de hecho, ya está siendo utilizado para redactar desde ensayos complejos hasta investigaciones académicas.

¿Cuál fue el resultado?

La investigación publicada por la revista especializada PLOS Digital Health informa que ChatGPT pudo responder correctamente cerca del 60% de las preguntas con las que era compatible, este porcentaje de aciertos es el que debe superar cualquier aspirante a doctor que realice la prueba.

Según ha recogido el artículo científico, demostró una concordancia del 94,6% en todas sus respuestas. La IA fue capaz de acertar entre el 52,4% y el 75% en cada uno de los pasos que componen la prueba, unas tasas que son muy próximas a las que necesitan los aspirantes.

Superó el rendimiento del PubMedGPT, un modelo similar a ChatGPT, aunque en este caso estaba formado exclusivamente con datos biomédicos, consiguiendo una puntuación del 50,8%. Esto se debe a que la solución de OpenAI está siendo entrenada de forma constante con grandes capacidades de información.

No es infalible

A pesar del gran trabajo que es capaz de realizar en diversas ocasiones, expertos e investigadores han alertado sobre el peligro de creernos todas las respuestas que ofrece «Es muy fácil que se descontrolen y ofrezcan información que no es veraz o que puede resultar controvertida. Hay un riesgo aunque sean muy buenos respondiendo preguntas y puedan parecer muy coherentes», dice José del Barrio, CEO y cofundador de Samaipata.

El hecho de que ChatGPT esté cerca de aprobar un examen para convertirse en médico, aunque haciendo ciertas trampas al ser incapaz de responder a todas las preguntas, demuestra que esta herramienta sigue mejorando con el paso del tiempo e incluso supera con creces a otros modelos entrenados exclusivamente con información biomédica.