Una conversación con Kevin Scott: ¿Qué sigue en IA?

Por ejemplo, he estado jugando con un sistema experimental que construí para mí usando GPT-3 diseñado para ayudarme a escribir un libro de ciencia ficción, que es algo que quería hacer desde que era adolescente. Tengo cuadernos llenos de sinopsis que he creado para libros teóricos, describiendo de qué tratan los libros y los universos donde se desarrollan. Con esta herramienta experimental, he podido romper el atasco. Cuando escribía un libro a la antigua usanza, si tenía 2000 palabras en un día, me sentía muy bien conmigo mismo. Con esta herramienta, he tenido días en los que puedo escribir 6000 palabras en un día, lo que para mí es mucho. Se siente como un proceso cualitativamente más energizante que lo que estaba haciendo antes.

Este es el “copiloto para todo” sueño—que tendría un copiloto que podría sentarse a su lado mientras realiza cualquier tipo de trabajo cognitivo, ayudándolo no solo a hacer más, sino también a mejorar su creatividad de maneras nuevas y emocionantes.

Este aumento de la productividad es claramente un impulso para su satisfacción. ¿Por qué estas herramientas traen más alegría al trabajo?

Todos usamos herramientas para hacer nuestro trabajo. Algunos de nosotros realmente disfrutamos adquirir las herramientas, dominarlas y descubrir cómo implementarlas de una manera súper efectiva para hacer lo que estamos tratando de hacer. Creo que eso es parte de lo que está pasando aquí. En muchos casos, las personas ahora tienen herramientas nuevas e interesantes y fundamentalmente más efectivas que las que tenían antes. Hicimos un estudio que encontró que el uso de herramientas sin código o de bajo código tuvo un impacto positivo de más del 80 % en la satisfacción laboral, la carga de trabajo general y la moral de los usuarios. Especialmente para las herramientas que se encuentran en sus etapas relativamente tempranas, eso es solo un gran beneficio para ver.

Para algunos trabajadores, está literalmente mejorando ese flujo central en el que se involucran cuando están haciendo el trabajo; te acelera. Es como tener un mejor par de zapatos para correr para correr una carrera o un maratón. Esto es exactamente lo que estamos viendo con las experiencias que los desarrolladores tienen con Copilot; ellos estan reportando que Copilot los ayuda a mantenerse en el flujo y mantiene sus mentes más agudas durante lo que solían ser tareas aburridas y repetitivas. Y cuando las herramientas de IA pueden ayudar a eliminar la monotonía de un trabajo, algo que es súper repetitivo o molesto o que se interpone en su camino para llegar a lo que realmente disfrutan, como era de esperar, mejora la satisfacción.

Personalmente, estas herramientas me permiten estar en estado de flujo por más tiempo que antes. El enemigo del flujo creativo es la distracción y quedarse atascado. Llego a un punto en el que no sé muy bien cómo resolver lo siguiente, o lo siguiente es, como, «Tengo que ir a buscar esto». Tengo que cambiar el contexto de lo que estaba haciendo para resolver el subproblema”. Estas herramientas me resuelven cada vez más el subproblema para que me mantenga en el flujo.

Además de GitHub Copilot y DALL∙E 2, la IA está apareciendo en los productos y servicios de Microsoft de otras maneras. ¿Cómo está mejorando la IA de próxima generación los productos actuales, como Teams y Word?

Una pintura al óleo impresionista de una mujer en una videollamada.Esta es la gran historia no contada de la IA. Hasta la fecha, la mayoría de los beneficios de la IA se distribuyen en 1,000 cosas diferentes en las que es posible que ni siquiera aprecies por completo la cantidad de experiencia que obtienes con el producto que proviene de un sistema de aprendizaje automático.

Por ejemplo, estamos sentados aquí en este equipos llamada en video y, en el sistema, están todos estos parámetros que fueron aprendidos por un algoritmo de aprendizaje automático. Hay búferes de fluctuación para el sistema de audio para suavizar la comunicación. El desenfoque detrás de usted en su pantalla es un algoritmo de aprendizaje automático en el trabajo. Hay más de una docena de sistemas de aprendizaje automático que hacen que esta experiencia sea más agradable para los dos. Y eso es ciertamente cierto en todo Microsoft.

Hemos pasado del aprendizaje automático en algunos lugares a literalmente 1000 elementos de aprendizaje automático distribuidos en diferentes productos, desde cómo funciona su cliente de correo electrónico de Outlook, su texto predictivo en Word, su experiencia de búsqueda en Bing, hasta cómo se ve su fuente en Xbox. Juegos en la nube y LinkedIn. Hay IA por todas partes que hace que estos productos sean mejores.

Una de las grandes cosas que ha cambiado en los últimos dos años es que solía haber un modelo especializado para cada una de estas tareas que tenemos en todos nuestros productos. Ahora tiene un solo modelo que se usa en muchos lugares porque son ampliamente útiles. Poder invertir en estos modelos que se vuelven más potentes con escala—y luego, tener todas las cosas construidas sobre el modelo se benefician simultáneamente de las mejoras que está haciendo—es enorme.

La investigación y el desarrollo de IA de Microsoft continúan a través de iniciativas como AI4Ciencia y IA para bien. ¿Qué es lo que más le emociona de esta área de la IA?

Una pintura al óleo impresionista de un grupo de científicos en un laboratorio nuclear.Los problemas más desafiantes que enfrentamos como sociedad en este momento están en las ciencias. Cómo curar estas enfermedades intratablemente complicadas? Cómo prepárate para la próxima pandemia? ¿Cómo proporcionas atención médica asequible y de alta calidad para una población que envejece? ¿Cómo ayuda a educar a más niños a escala en las habilidades que necesitarán para el futuro? Cómo desarrollar tecnologías que revertirán algunos de los efectos negativos de las emisiones de carbono a la atmósfera? Estamos explorando cómo llevar algunos de estos emocionantes desarrollos en IA a esos problemas.

Los modelos en estas aplicaciones de ciencia básica tienen las mismas propiedades de escala que los modelos de lenguaje grande. Construyes un modelo, lo pones en un modo autosupervisado donde está aprendiendo de una simulación o está aprendiendo de su propia capacidad para observar un dominio particular, y luego el modelo que obtienes te permite cambiar drásticamente el rendimiento de un aplicación, ya sea está haciendo una simulación de dinámica de fluidos computacional o está haciendo dinámica molecular para el diseño de fármacos.

Hay una inmensa oportunidad allí. Esto significa mejores medicamentos, significa tal vez podamos encontrar el catalizador Todavía no tenemos que solucionar nuestro problema de emisiones de carbono, significa acelerar en todos los ámbitos la forma en que los científicos y otras personas con grandes ideas pueden trabajar para tratar de resolver los mayores desafíos de la sociedad.

¿Cómo han contribuido los avances en las técnicas informáticas y el hardware a los avances en IA?

Lo fundamental que subyace a casi todo el progreso reciente que hemos visto en IA es cuán crítica ha demostrado ser la importancia de la escala. Resulta que los modelos entrenados en más datos con más poder de cómputo tienen un conjunto de capacidades mucho más rico y generalizado. Si queremos seguir impulsando este progreso más lejos—y para ser claros, en este momento no vemos ningún fin a los beneficios de una mayor escala—nosotros necesitamos optimizar y escalar nuestro poder de cómputo tanto como podamos.

Anunciamos nuestra primera supercomputadora Azure AI hace dos años, y en nuestra conferencia de desarrolladores Build de este año, compartí que ahora tenemos varios sistemas de supercomputación que estamos bastante seguros de que son las supercomputadoras AI más grandes y poderosas del mundo en la actualidad. Nosotros y OpenAI usamos esta infraestructura para entrenar casi todos nuestros modelos grandes de última generación, ya sea nuestro turingcódigo Z y florencia modelos en Microsoft o los modelos GPT, DALL∙E y Codex en IA abierta. Y nosotros recientemente anunció una colaboración con NVIDIA para construir una supercomputadora con infraestructura Azure combinada con GPU NVIDIA.

Imagen de supercomputadora generada por un productor usando DALL∙E 2.

Parte de este progreso solo ha sido a través de la escala de cómputo de fuerza bruta con grupos de GPU cada vez más grandes. Pero tal vez un avance aún mayor sea la capa de software que optimiza la forma en que los modelos y los datos se distribuyen en estos sistemas gigantes, tanto para entrenar los modelos como para luego entregarlos a los clientes. Si vamos a presentar estos grandes modelos como plataformas con las que las personas pueden crear, no solo pueden ser accesibles para la pequeña cantidad de empresas de tecnología en el mundo con suficientes recursos para construir supercomputadoras gigantes.

Entonces, hemos invertido una tonelada en software como velocidadprofunda para aumentar la eficiencia de la formación, y la Tiempo de ejecución ONNX por inferencia. Optimizan el costo y la latencia y, en general, nos ayudan a hacer que los modelos de IA más grandes sean más accesibles y valiosos para las personas. Estoy muy orgulloso de los equipos que tenemos trabajando en estas tecnologías porque Microsoft realmente está liderando la industria aquí, y estamos haciendo todo de código abierto, así que otros pueden seguir mejorando.

Todos estos avances se están desarrollando en medio de una preocupación constante de que la IA afectará los empleos. ¿Cómo piensas sobre el tema de la IA y los empleos?

Vivimos en una época de extraordinaria complejidad y de cambios macroeconómicos históricos, y mientras miramos hacia el futuro a 5 o 10 años, incluso para lograr un balance neto neutral para todo el mundo, vamos a necesitar nuevas formas de productividad para todos nosotros para poder seguir disfrutando del progreso. Queremos construir estas herramientas de IA como plataformas que muchas personas puedan usar para construir negocios y resolver problemas. Creemos que estas plataformas democratizan el acceso a la IA a muchas más personas. Con ellos, obtendrá un conjunto más rico de problemas resueltos y tendrá un grupo más diverso de personas que podrán participar en la creación de tecnología.

Con la creación de instancias anterior de IA, necesitaba una gran cantidad de experiencia solo para comenzar. Ahora puedes llamar Servicios cognitivos de Azurepuedes llamar al Servicio Open AI de Azure y construya productos complicados además de estas cosas sin tener que ser necesariamente tan experto en IA que tenga que ser capaz de entrenar su propio modelo grande desde cero.



Fuente del artículo

Deja un comentario