La tecnológica asegura que la IA será “la puerta de entrada a un universo de conocimiento” y, con esa premisa, se ha propuesto desarrollar modelos fiables, aplicados a productos que definan categorías y que comprendan las particularidades de cada usuario.
MAI-Voice-1
El primero de ellos es MAI-Voice-1, un modelo de voz capaz de generar audio expresivo de alta fidelidad en menos de un segundo y con una duración de hasta un minuto. Funciona con una sola GPU, lo que lo convierte en uno de los sistemas de voz más eficientes disponibles en la actualidad. Ya está integrado en Copilot Daily y Podcasts, y también se puede probar en Copilot Labs con demostraciones de narración y habla expresiva.
MAI-1-preview
Por otra parte, Microsoft ha iniciado las pruebas públicas de MAI-1-preview a través de la plataforma de evaluación LMArena. Este modelo ha sido preentrenado y postentrenado con unas 15.000 GPU Nvidia H100, lo que le dota de una gran capacidad para seguir instrucciones y dar respuestas útiles a consultas cotidianas. De momento, se está implementando en versión preliminar en Copilot para algunos escenarios de texto, con el fin de seguir puliéndolo a partir de los comentarios de los usuarios y de los probadores de confianza.
Con esta estrategia, la compañía que lidera Satya Nadella busca orquestar un ecosistema de modelos especializados que respondan a diferentes intenciones y situaciones, generando un “valor inmenso” para los usuarios, según ha explicado Microsoft.