Interspeech 2022 – Investigación de aprendizaje automático de Apple

Apple patrocina la 34.ª conferencia Interspeech, que se llevará a cabo en Incheon, República de Corea, del 18 al 22 de septiembre. Interspeech es una conferencia mundial centrada en la inteligencia cognitiva para el procesamiento y la aplicación del habla.

Todos los asistentes de Interspeech están invitados a pasar por el stand de Apple (stand número B5, ubicado en el Grand Ballroom Lobby en el segundo piso de Songdo ConvensiA) para ver nuestra demostración y conversar con los reclutadores disponibles y el personal del stand.

Calendario

A continuación se muestra el calendario de talleres y eventos patrocinados por Apple. Visita el Sitio web de Interspeech 2022 para el horario completo de la conferencia.

sábado 17 de septiembre

lunes 19 de septiembre

martes 20 de septiembre

miércoles 21 de septiembre

jueves 22 de septiembre

Trabajos aceptados

Documentos aceptados en la conferencia

Detección de voz dirigida por dispositivos: regularización mediante destilación para modelos con supervisión débil

Vineet Garg, Ognjen (Oggi) Rudovic, Pranay Dighe, Ahmed H. Abdelaziz, Erik Marchi, Saurabh Adya, Chandra Dhir, Ahmed Tewfik

Control de énfasis para TTS neuronal paralelo

Shreyas Seshadri, Tuomo Raitio, Dan Castellani, Jiangchuan Li

Mejora de la detección de activadores de voz con aprendizaje de métricas

Prateeth Nayak, Takuya Higuchi, Anmol Gupta, Shivesh Ranjan, Stephen Shum, Siddharth Sigtia, Erik Marchi, Varun Lakshminarasimhan, Minsik Cho, Saurabh Adya, Chandra Dhir, Ahmed Tewfik

Representación eficiente del espacio de modelos de lenguaje de consulta centrados en entidades

Christophe Van Gysel, Mirko Hannemann, Ernest Pusateri, Youssef Oualil, Ilya Oparin

Emoción del habla: investigación de representaciones de modelos, aprendizaje multitarea y destilación de conocimiento

Vikramjit Mitra, Hsiang-Yun Sherry Chien, Vasudha Kowtha, Joseph Yitan Cheng, Erdrin Azemi

Modelado de esfuerzo vocal en TTS neuronal para mejorar la inteligibilidad del habla sintética en ruido

Tuomo Raitio, Petko Petkov, Jiangchuan Li, Muhammed Shifas, Andrea Davis, Yannis Stylianou

Agradecimientos

Rin Metcalf Susa es miembro de la Estilos de habla y estilos de interacción Comité Científico de Sesión Especial en Interspeech 2022.

Lyan Verwimp, Mirko Hannemann, Shreyas Seshadri, Tuomo Raitio, Barry Theobald, Zak Aldeneh y Vikram Mitra son revisores de Interspeech 2022.

Innovemos juntos. Cree increíbles experiencias de aprendizaje automático con Apple. Descubra oportunidades para investigadores, estudiantes y desarrolladores visitando nuestra página Trabaja con nosotros.

Fuente del artículo

¿Que te ha parecido?

Deja un comentario