Apple patrocina la 34.ª conferencia Interspeech, que se llevará a cabo en Incheon, República de Corea, del 18 al 22 de septiembre. Interspeech es una conferencia mundial centrada en la inteligencia cognitiva para el procesamiento y la aplicación del habla.
Todos los asistentes de Interspeech están invitados a pasar por el stand de Apple (stand número B5, ubicado en el Grand Ballroom Lobby en el segundo piso de Songdo ConvensiA) para ver nuestra demostración y conversar con los reclutadores disponibles y el personal del stand.
Calendario
A continuación se muestra el calendario de talleres y eventos patrocinados por Apple. Visita el Sitio web de Interspeech 2022 para el horario completo de la conferencia.
sábado 17 de septiembre
lunes 19 de septiembre
martes 20 de septiembre
- PRESENTACIÓN ORAL
- Detección de voz dirigida por dispositivos: regularización mediante destilación para modelos con supervisión débil
- De 10:00 a. m. a 12:00 p. m. KST en las habitaciones 113 – 115
- Vineet Garg, Ognjen (Oggi) Rudovic, Pranay Dighe, Ahmed H. Abdelaziz, Erik Marchi, Saurabh Adya, Chandra Dhir, Ahmed Tewfik
- Mejora de la detección de activadores de voz con aprendizaje de métricas
- De 1:30 p. m. a 3:30 p. m. KST en las habitaciones 113 a 115
- Prateeth Nayak, Takuya Higuchi, Anmol Gupta, Shivesh Ranjan, Stephen Shum, Siddharth Sigtia, Erik Marchi, Varun Lakshminarasimhan, Minsik Cho, Saurabh Adya, Chandra Dhir, Ahmed Tewfik
- PRESENTACIÓN DE POSTER O CARTEL
- Modelado de esfuerzo vocal en TTS neuronal para mejorar la inteligibilidad del habla sintética en ruido
- De 1:30 p. m. a 3:30 p. m. KST en el salón de baile Premier
- Tuomo Raitio, Petko Petkov, Jiangchuan Li, Muhammed Shifas, Andrea Davis, Yannis Stylianou
miércoles 21 de septiembre
jueves 22 de septiembre
Trabajos aceptados
Documentos aceptados en la conferencia
Detección de voz dirigida por dispositivos: regularización mediante destilación para modelos con supervisión débil
Vineet Garg, Ognjen (Oggi) Rudovic, Pranay Dighe, Ahmed H. Abdelaziz, Erik Marchi, Saurabh Adya, Chandra Dhir, Ahmed Tewfik
Control de énfasis para TTS neuronal paralelo
Shreyas Seshadri, Tuomo Raitio, Dan Castellani, Jiangchuan Li
Mejora de la detección de activadores de voz con aprendizaje de métricas
Prateeth Nayak, Takuya Higuchi, Anmol Gupta, Shivesh Ranjan, Stephen Shum, Siddharth Sigtia, Erik Marchi, Varun Lakshminarasimhan, Minsik Cho, Saurabh Adya, Chandra Dhir, Ahmed Tewfik
Representación eficiente del espacio de modelos de lenguaje de consulta centrados en entidades
Christophe Van Gysel, Mirko Hannemann, Ernest Pusateri, Youssef Oualil, Ilya Oparin
Emoción del habla: investigación de representaciones de modelos, aprendizaje multitarea y destilación de conocimiento
Vikramjit Mitra, Hsiang-Yun Sherry Chien, Vasudha Kowtha, Joseph Yitan Cheng, Erdrin Azemi
Modelado de esfuerzo vocal en TTS neuronal para mejorar la inteligibilidad del habla sintética en ruido
Tuomo Raitio, Petko Petkov, Jiangchuan Li, Muhammed Shifas, Andrea Davis, Yannis Stylianou
Agradecimientos
Rin Metcalf Susa es miembro de la Estilos de habla y estilos de interacción Comité Científico de Sesión Especial en Interspeech 2022.
Lyan Verwimp, Mirko Hannemann, Shreyas Seshadri, Tuomo Raitio, Barry Theobald, Zak Aldeneh y Vikram Mitra son revisores de Interspeech 2022.
Innovemos juntos. Cree increíbles experiencias de aprendizaje automático con Apple. Descubra oportunidades para investigadores, estudiantes y desarrolladores visitando nuestra página Trabaja con nosotros.