Microsoft crea una herramienta capaz de imitar cualquier voz escuchándola sólo tres segundos
Lapatilla
enero 10 2023, 6:15 pm
Cortesía
Varias herramientas creadas con técnicas de inteligencia artificial y aprendizaje máquina han conseguido sorprendernos en los últimos años. Dall-E, Midjourney o Stable Diffusion, por ejemplo, son capaces de crear imágenes a partir de descripciones de texto. ChatGPT puede conversar como un humano, explicar cualquier concepto y elaborar resúmenes de forma coherente.
Por: El Mundo
Ahora, Microsoft ha conseguido también aplicar estas técnicas para crear un motor de síntesis de voz capaz de imitar la voz de cualquier persona tan sólo escuchándola hablar durante tres segundos. La herramienta se llama VALL-E y es capaz de imitar el tono y la inflexión con una precisión sorprendente.
Los modelos de síntesis de voz que utilizan técnicas de aprend...