Conozca Med-PaLM: un modelo de lenguaje extenso que respalda el dominio médico para brindar respuestas seguras y útiles

El lenguaje facilita interacciones cruciales para y entre médicos, investigadores y pacientes en el campo compasivo de la medicina. Pero el uso del lenguaje por parte de los modelos actuales de IA para aplicaciones médicas y de atención médica no ha estado a la altura de las expectativas. Aunque útiles, estos modelos carecen de expresividad y capacidades interactivas y son principalmente sistemas de una sola tarea. Debido a esto, existe una brecha entre lo que son capaces de hacer los modelos actuales y lo que podrían esperar en las operaciones clínicas reales.

Ahora es posible repensar los sistemas de IA utilizando el lenguaje como una herramienta para mediar en la interacción humano-IA debido a los desarrollos recientes en modelos de lenguaje grande (LLM). Los LLM son sistemas de IA preentrenados de tamaño considerable que se pueden aplicar fácilmente a varias aplicaciones y dominios. La capacidad de estos modelos expresivos e interactivos para adquirir representaciones generalmente utilizables del conocimiento incorporado en corpus médicos, a escala, muestra una promesa considerable.

Los requisitos de calidad de los modelos para fines médicos son altos. Entonces, los científicos de Deepminds y Google Research crearon un gran modelo de lenguaje llamado Med-PaLM. A través de la transmisión de diversos conjuntos de datos, Med-PaLM aborda preguntas y consultas de opción múltiple de profesionales médicos y no profesionales. MedicationQA, MedQA, PubMedQA, LiveQA, MedMCQA y MMLU son las fuentes de estos conjuntos de datos. Para mejorar MultiMedQA, también se incluyó un nuevo conjunto de datos llamado HealthSearchQA que comprende consultas médicas seleccionadas y comúnmente buscadas.

Conozca Med PaLM un modelo de lenguaje extenso que respalda el

El conjunto de datos de HealthsearchQA contiene 3375 preguntas frecuentes de los usuarios. Se recopiló utilizando diagnósticos médicos de semillas y los síntomas que los acompañaron. Para analizar los LLM con MultiMedQA, este modelo se creó con los 540 000 millones de parámetros LLM PaLM y su variante ajustada por instrucciones Flan-PaLM.

Los científicos se concentraron en responder preguntas médicas para evaluar el potencial de los LLM en medicina. Las habilidades de comprensión lectora, la capacidad de retener con precisión la información médica y la manipulación del conocimiento experto son necesarias para responder a las consultas médicas. Hay una gran cantidad de conocimientos médicos de alta calidad y cantidad. El ámbito del campo del conocimiento médico solo está parcialmente cubierto por los puntos de referencia existentes, que están intrínsecamente limitados. Sin embargo, el uso de varios conjuntos de datos para responder preguntas médicas permite una evaluación más completa del conocimiento de LLM que la precisión de opción múltiple o métricas para la generación de lenguaje natural como BLEU.

1673290391 167 Conozca Med PaLM un modelo de lenguaje extenso que respalda el
Fuente: https://arxiv.org/pdf/2212.13138.pdf

Según las afirmaciones actuales, Med-PaLM funciona muy bien, especialmente en comparación con Flan-PaLM. Todavía debe superar el juicio de un profesional médico humano. Actualmente, un equipo de expertos médicos descubrió que el 92,6 por ciento de las respuestas de Med-PaLM coincidían con las proporcionadas por los médicos.

Esto es notable, teniendo en cuenta que solo el 61,9 por ciento de las respuestas Flan-PaLM de formato largo se encontraron consistentes con las evaluaciones médicas. En comparación con el 6,5 por ciento de las respuestas creadas por los médicos y el 29,7 por ciento de las respuestas de Flan-PaLM, se pensó que solo el 5,8 por ciento de las respuestas de Med-PaLM eran posiblemente dañinas. Por lo tanto, las respuestas de Med-PaLM son significativamente más seguras.

Med-PaLM ha mejorado la precisión del modelo en comparación con el otro modelo, lo cual es un gran punto a favor. La discusión interesante será cómo estos modelos pueden convertirse en un apoyo completo y fiable para los médicos y otros expertos médicos.


Revisar la Papel. Todo el crédito de esta investigación es para los investigadores de este proyecto. Además, no olvides unirte nuestra página de Reddit, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias de investigación de IA, interesantes proyectos de IA y más.


screenshot 20220728 120154 bumble yrjd fans

Soy un estudiante de pregrado en IIIT HYDERABAD que busca Btech en ciencias de la computación y una maestría en humanidades computacionales. Estoy interesado en el aprendizaje automático y de datos. También participo activamente en la investigación de soluciones de inteligencia artificial para la seguridad vial.


Fuente del artículo

Deja un comentario