Microsoft ofrecer谩 cancelaci贸n de ruido basada en inteligencia artificial a los equipos de Microsoft en plataformas Mac y m贸viles

Equipos de Microsoft

El mes pasado, Microsoft anunci贸 la introducci贸n de una funci贸n de cancelaci贸n de ruido basada en IA en tiempo real para los usuarios de escritorio de Microsoft Teams Windows. Esta funci贸n puede suprimir ruidos innecesarios, como mover papeles, portazos y ladridos de perros durante una llamada de equipo. La reducci贸n de ruido basada en IA analiza la se帽al de audio de una persona y utiliza redes neuronales profundas especialmente entrenadas para filtrar el ruido y mantener solo la se帽al de voz. Microsoft anunci贸 hoy que est谩 trabajando para llevar la cancelaci贸n de ruido basada en IA a los equipos de Microsoft en plataformas Mac y m贸viles.

Microsoft tambi茅n explic贸 hoy c贸mo se desarroll贸 esta funci贸n sin utilizar datos reales del cliente. Microsoft ha optimizado el modelo de aprendizaje profundo para que pueda ejecutarse de manera eficiente en tiempo real en el cliente de escritorio del equipo con poco esfuerzo.

Para lograr esta diversidad de conjuntos de datos, creamos un gran conjunto de datos con aproximadamente 760 horas de datos de voz limpios y 180 horas de datos de ruido. Para cumplir con los estrictos est谩ndares de protecci贸n de datos de Microsoft, nos hemos asegurado de que no se registre ning煤n dato de cliente para este registro de datos. En cambio, usamos datos disponibles p煤blicamente o crowdsourcing para capturar ciertos escenarios. Para un lenguaje limpio, nos aseguramos de tener un equilibrio entre el lenguaje femenino y masculino, y recopilamos datos de m谩s de 10 idiomas que tambi茅n incluyen lenguajes tonales para garantizar que nuestro modelo no transmita el significado de una oraci贸n al distorsionar el sonido. de palabras cambia. Para los datos de ruido, registramos 150 tipos de ruido para asegurarnos de cubrir diferentes escenarios en los que nuestros clientes pueden entrar, desde escribir un teclado hasta tirar la cadena del inodoro o roncar. Otro aspecto importante fue incluir las emociones en nuestro lenguaje limpio para que no se supriman expresiones como re铆r o llorar. Las caracter铆sticas del entorno desde el que nuestros clientes asisten a las reuniones de su equipo online tambi茅n tienen un gran impacto en la se帽al de voz. Para capturar esta diversidad, hemos entrenado nuestro modelo con datos de m谩s de 3,000 ambientes de sala reales y m谩s de 115,000 salas creadas sint茅ticamente.

Dado que utilizamos el aprendizaje profundo, es importante contar con una potente infraestructura de entrenamiento de modelos. Usamos Microsoft Azure para que nuestro equipo pueda desarrollar versiones mejoradas de nuestro modelo ML. Otro desaf铆o es que la extracci贸n del habla original y limpia del sonido debe hacerse de tal manera que el o铆do humano la perciba como natural y agradable. Dado que no existen m茅tricas objetivas que se correlacionen altamente con la percepci贸n humana, hemos desarrollado un marco que nos permite enviar las muestras de audio procesadas a proveedores de crowdsourcing donde los oyentes humanos pueden calificar su calidad de audio en una escala de 1 a Califique 5 estrellas para obtener calificaciones de opini贸n promedio (MOS). Con estas calificaciones humanas, pudimos desarrollar una nueva m茅trica perceptiva que, junto con las calificaciones humanas subjetivas, nos permiti贸 dar pasos r谩pidos para mejorar la calidad de nuestros modelos de aprendizaje profundo.

Para habilitar la funci贸n de cancelaci贸n de ruido en equipos:

  1. Seleccione su foto de perfil en la esquina superior derecha de Teams, luego seleccione la configuraci贸n.
  2. Escoger equipo izquierda y luego debajo Reducci贸n de ruido, Elige una opcion.

  3. Desde la ventana de la reuni贸n:
    1. Escoger Mas opciones en los controles de la reuni贸n y luego seleccione Configuraci贸n de dispositivo.
    2. Debajo Reducci贸n de ruido, Elige una opcion.

Fuente: Microsoft