Diseño de sistemas de aprendizaje por refuerzo beneficiosos para la sociedad: el blog de investigación de inteligencia artificial de Berkeley

Diseno de sistemas de aprendizaje por refuerzo beneficiosos para la


El aprendizaje por refuerzo profundo (DRL) está pasando de un campo de investigación centrado en los juegos a una tecnología con aplicaciones del mundo real. Ejemplos notables incluyen el trabajo de DeepMind en controlar un reactor nuclear o en mejorar Compresión de vídeo de Youtubeo tesla intentando usar un método inspirado en MuZero para la planificación del comportamiento de vehículos autónomos. Pero el emocionante potencial para las aplicaciones de RL en el mundo real también debe venir con una buena dosis de precaución; por ejemplo, se sabe que las políticas de RL son vulnerables a explotacióny los métodos para el desarrollo de políticas seguras y sólidas son un área activa de investigación.

Al mismo tiempo que surgen poderosos sistemas de RL en el mundo real, el público y los investigadores expresan un mayor apetito por sistemas de aprendizaje automático justos, alineados y seguros. El enfoque de estos esfuerzos de investigación hasta la fecha ha sido dar cuenta de las deficiencias de los conjuntos de datos o las prácticas de aprendizaje supervisado que pueden dañar a las personas. Sin embargo, la capacidad única de los sistemas RL para aprovechar la retroalimentación temporal en el aprendizaje complica los tipos de riesgos y problemas de seguridad que pueden surgir.

Esta publicación amplía nuestra reciente papel blanco y trabajo de investigación, donde nuestro objetivo es ilustrar las diferentes modalidades que pueden tomar los daños cuando se aumentan con el eje temporal de RL. Para combatir estos nuevos riesgos sociales, también proponemos un nuevo tipo de documentación para sistemas dinámicos de aprendizaje automático que tiene como objetivo evaluar y monitorear estos riesgos antes y después del despliegue.

Leer más

La guía definitiva para escribir un guión perfecto para el IVA conversacional impulsado por IA

La guia definitiva para escribir un guion perfecto para el

Se espera que el mercado global de IA conversacional aumente a un ritmo CAGR del 21,4% y supera los $13.291,3 millones de 2021 a 2028. Dada la digitalización generalizada con tecnologías de IA como el aprendizaje automático, el procesamiento del lenguaje natural y más, no es difícil suponer que el futuro pertenece a los asistentes virtuales inteligentes conversacionales impulsados ​​por IA.

Leer más

Replanteamiento de Human-in-the-Loop para la inteligencia artificial aumentada: el blog de investigación de inteligencia artificial de Berkeley

Replanteamiento de Human in the Loop para la inteligencia artificial aumentada el blog


Replanteamiento de Human in the Loop para la inteligencia artificial aumentada el blog

Figura 1: En las aplicaciones del mundo real, creemos que existe un ciclo humano-máquina en el que los humanos y las máquinas se complementan mutuamente. Lo llamamos Inteligencia Artificial Aumentada.

¿Cómo construimos y evaluamos un sistema de IA para aplicaciones del mundo real? En la mayoría de las investigaciones de IA, la evaluación de los métodos de IA implica un proceso de entrenamiento, validación y prueba. Los experimentos generalmente se detienen cuando los modelos tienen un buen rendimiento de prueba en los conjuntos de datos informados porque se supone que la distribución de datos del mundo real está modelada por los datos de validación y prueba. Sin embargo, las aplicaciones del mundo real suelen ser más complicadas que un solo proceso de capacitación, validación y prueba. La mayor diferencia son los datos en constante cambio. Por ejemplo, los conjuntos de datos de vida silvestre cambian en la composición de clases todo el tiempo debido a la invasión, reintroducción, recolonización y movimientos estacionales de animales. Un modelo entrenado, validado y probado en conjuntos de datos existentes puede romperse fácilmente cuando los datos recién recopilados contienen especies nuevas. Afortunadamente, contamos con métodos de detección fuera de distribución que pueden ayudarnos a detectar muestras de especies nuevas. Sin embargo, cuando queremos expandir la capacidad de reconocimiento (es decir, poder reconocer nuevas especies en el futuro), lo mejor que podemos hacer es ajustar los modelos con nuevas anotaciones verificadas en el terreno. En otras palabras, necesitamos incorporar anotaciones/esfuerzo humano independientemente de cómo se desempeñen los modelos en conjuntos de prueba anteriores.

Leer más

Potencie su experiencia de Salesforce con IA conversacional

Potencie su experiencia de Salesforce con IA conversacional

La integración de Salesforce y Kore.ai

En el mundo digital actual, utilizamos numerosas aplicaciones para llevar a cabo nuestras tareas profesionales del día a día. La digitalización ha permitido un fácil acceso a estas aplicaciones al permitirnos usarlas en cualquier lugar y en cualquier momento. Agregar una capa de IA conversacional a estas aplicaciones las hace más intuitivas.

Leer más