12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Juan David Castilla El alcalde de Coatepec, Jorge Ignacio Luna Hernández, informó que su administración se encuentra revisando exhaustivamente la documentación legal del fraccionamiento San Lucas, tras precisar que todos los permisos de construcción y cambios de uso de suelo fueron heredados de la gestión municipal anterior. Recién ha circul
Hora Cero
Desde el Café Cuando tienes que suplicar para sobrevivir Bernardo Gutiérrez Parra Ayer por la mañana un “analista político” dijo en un programa de radio que de acuerdo a sesudos sondeos, el PRI corre el riesgo de no llegar vivo al 2030 ya que puede perder el registro después de las elecciones del 2027. Tras […]La entrada Cuando tiene
Hora Cero
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
En el competitivo mundo de la manufactura y los procesos industriales a gran escala, mantener la temperatura bajo un control estricto ha dejado de ser una simple opción para convertirse en una necesidad operativa innegociable.
Lado.mx
China se ha consolidado como uno de los actores más influyentes en el desarrollo de la inteligencia artificial a nivel global.
Lado.mx
Morena presiona al PT en el Senado para avanzar con el plan B de la reforma electoral; persisten tensiones y negociaciones sin acuerdos claros.
El Financiero
La reforma sobre inteligencia artificial busca proteger imagen y voz, pero su enfoque en regular el uso de datos podría frenar innovación, generar incertidumbre jurídica y tensionar compromisos del T-MEC.
El Financiero
Rubí Patricia Gómez Tagle, una madre buscadora originaria de Mazatlán, Sinaloa, que buscaba a su hijo Edgar Daniel López Gómez, fue asesinada a principios de marzo de este año, en su propia casa.
El Financiero
Edgar Reséndiz señaló que los afectados no acuden al Ministerio Público por desconfianza. Las mesas con el fiscal buscan promover la denuncia
Periódico Correo
Las tendencias demográficas definen el rumbo y no se equivocan. Ahora resulta que, después de un amplio y arduo trabajo científico para mejorar la calidad de vida y ampliar la esperanza de vida, las instituciones y las familias están en aprietos y se preguntan: ¿ahora qué hacemos con tantos adultos mayores? La respuesta implica un …El c
Tribuna Noticias
Las autoridades ambientales activaron el doble Hoy No Circula para el miércoles 11 de marzo de 2026 en la Zona Metropolitana del Valle de México. La medida responde a altos niveles de contaminación atmosférica registrados durante la jornada previa. La restricción aplica tanto en Ciudad de México como en 18 municipios del Estado de México. [&
Seunonoticias.mx
El programa Hoy No Circula aplica este miércoles 25 de marzo de 2026 en la Ciudad de México y el Estado de México. La medida limita la circulación de vehículos con el objetivo de reducir emisiones contaminantes en la zona metropolitana. Los automóviles que no podrán circular este día son aquellos con engomado rojo y […]The post Mantie
Seunonoticias.mx
La restricción vehicular está vigente de las 05:00 a las 22:00 horas de este miércoles
El Imparcial
Lotería Nacional dedica sorteo especial a migrantes: “México con M de Migrante” El Gran Sorteo Especial No. 303 rinde homenaje a las y los paisanos que construyen México desde la distancia lreyesMar, 19/08/2025 - 16:47
Record
Lotería Nacional y Gobierno de Morelos lanzan el Sorteo “México con M de Migrante” en honor a la comunidad migrante El Gran Sorteo Especial No. 303 se celebrará el 15 de septiembre en homenaje a las y los migrantes lreyesJue, 28/08/2025 - 15:14
Record
Quienes cuenten con algún cachito premiado pueden reclamar su premio tanto en los centros de venta autorizados como en el edificio de la Lotería Nacional ubicado en Ciudad de México
Infobae
La contingencia ambiental ya pegó de lleno en Ciudad de México y Estado de México. La CAMe activó la Fase 1 por ozono este martes 10 de marzo a las 16:00 horas. Eso significa que este miércoles 11 de marzo varios autos no podrán salir entre las 5:00 y las 22:00 horas en la Zona M
Xataka México
Las autoridades ambientales activaron el doble Hoy No Circula para el miércoles 11 de marzo de 2026 en la Zona Metropolitana del Valle de México. La medida responde a altos niveles de contaminación atmosférica registrados durante la jornada previa. La restricción aplica tanto en Ciudad de México como en 18 municipios del Estado de México. [&
Seunonoticias.mx
La tarde de este martes, la Comisión Ambiental de la Megalópolis activó la Fase 1 de contingencia ambiental por ozono en la Zona Metropolitana del Valle de México, luego de que la calidad del aire se disparara a niveles riesgosos. Doble Hoy No Circula este miércoles 11 de marzo La medida implica Doble Hoy No …El cargo Activan contingenci
Tribuna Noticias
Últimas noticias
FGE extingue fiscalía que atendía casos de corrupción previos a 2018
Plantas de tratamiento de aguas residuales, claves para la salud y la economía
En los últimos ocho años, Morena ha destinado millonaria cifra para su promoción
Operativo encubierto revela a tránsitos recibiendo dinero
Sobornos a tránsitos surgen por malas prácticas viales
Mancha de crudo avanza por el Golfo y amenaza costas de Tamaulipas
Se consolida el gobierno de Tamaulipas en materia de salud
Priorizó Américo Villarreal inversión en seguridad durante el cuarto año de gobierno
Inician las preparación para examen CENEVAL
Presencia del portaaviones USS Nimitz en el Pacífico mexicano reaviva el debate sobre la soberanía en México
Dólar se mantiene por debajo de los 20 pesos HOY 25 de marzo en Veracruz
Vinculan a proceso a presunto agresor sexual
La SEP responde al asesinato de dos maestras en Michoacán
Temas del día de EFE News Latino del miércoles 25 de marzo de 2026
Borja Iglesias: "Hace unos meses igual no lo imaginaba, pero hoy sí sueño con el Mundial"