Modelos de lenguaje muestran potencial como herramientas educativas en endodoncia
Introducción
Un estudio reciente evaluó la utilidad de dos chatbots de inteligencia artificial —GPT‑4o y Gemini 2.5 Pro— como auxiliares pedagógicos en la formación en endodoncia, especialmente para el entrenamiento del razonamiento diagnóstico y la planificación terapéutica en un formato similar al examen oral de la American Board of Endodontics (ABE).
Qué se evaluó y cómo
- Investigador principal: Dr. Poorya Jalali, profesor clínico asociado y director de posgrado en Endodoncia del Texas A&M College of Dentistry.
- Diseño: simulación de examen oral del ABE con tres casos clínicos desarrollados por dos endodoncistas certificados por la junta.
- Formato: a cada caso se le proporcionó un perfil detallado del paciente y se formularon 20 preguntas abiertas; los chatbots respondieron a los estímulos escritos y recibieron descripciones de los hallazgos radiográficos.
- Evaluación: las respuestas fueron calificadas de forma independiente por los mismos dos examinadores en cuanto a validez clínica y exactitud/relevancia de las referencias de soporte; además se otorgó una puntuación global en una escala de 0 a 3.
- Publicación: el estudio, titulado “Artificial intelligence chatbots taking American Board of Endodontics simulated oral board examination”, se publicó en línea el 26 de febrero de 2026 en el Journal of Endodontics.
Resultados clave
- En general, la mayoría de las respuestas de ambos modelos fueron calificadas entre aceptables y excelentes.
- En la escala 0–3, Gemini 2.5 Pro obtuvo una puntuación media global de 2,83 y GPT‑4o de 2,73.
- El análisis estadístico, que consideró diferencias entre escenarios de caso, preguntas individuales y examinadores, no halló una diferencia significativa entre ambos modelos ni en la validez clínica de las respuestas ni en el rendimiento global.
- Se observó que GPT‑4o mostró variación en su rendimiento según el tipo de caso, mientras que Gemini 2.5 Pro fue más consistente entre los tres escenarios evaluados.
- Como observó el autor: “AI, and particularly large language models (LLMs), are already being used widely by students and educators. We wanted to understand not only whether they can answer questions but also how accurate and reliable they are in a clinically relevant setting.”
Relevancia para la práctica odontológica y la enseñanza
Los autores plantean que, si se emplean de manera supervisada y con criterio humano, los chatbots basados en LLM podrían desempeñar un papel como herramientas complementarias en la educación endodóntica. Entre las aplicaciones potenciales identificadas en el estudio están:
- Proporcionar un entorno interactivo para que estudiantes y residentes practiquen la formulación de respuestas a preguntas clínicas tipo examen oral.
- Ayudar en la preparación para evaluaciones de tipo board y fomentar una reflexión más crítica sobre el razonamiento clínico.
- Ofrecer comparaciones entre el razonamiento del aprendiz y respuestas modelo para identificar áreas de mejora.
Limitaciones y contexto
- Los autores subrayan que los resultados no implican que los modelos aprobarían de forma fiable un examen oral real del ABE, que exige interacción en vivo, respuesta bajo tiempo limitado e interpretación radiográfica independiente.
- En este estudio los chatbots respondieron a indicaciones escritas y se les proporcionaron descripciones de radiografías; no realizaron pruebas clínicas, exploraciones ni interpretaciones radiográficas directas en imágenes.
- Como se indicó: “These systems cannot diagnose or plan treatment independently. They cannot perform clinical tests, examine the patient or interpret radiographs in a real clinical setting. They are LLMs, and their performance depends on the information provided to them.”
- El trabajo forma parte de una serie investigadora; estudios previos del grupo evaluaron LLMs con preguntas escritas tipo examen y los autores mencionan que están explorando el uso de estas herramientas para la elaboración de preguntas de alta calidad, con resultados piloto prometedores.
Conclusión
El estudio sugiere que modelos de lenguaje actuales pueden reproducir razonamiento clínico estructurado y responder preguntas en formato de examen oral a un nivel comparable al de formaciones avanzadas, por lo que podrían servir como complemento educativo en endodoncia. Sin embargo, su uso requiere supervisión humana y reconocimiento de las limitaciones inherentes a los LLM en contextos clínicos reales.
FUENTE
https://www.dental-tribune.com/news/ai-chatbots-show-promise-as-educational-adjuncts-in-endodontics/

