12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Oaxaca de Juárez, 21 de noviembre. El Municipio de Oaxaca de Juárez informa a la ciudadanía que cuenta con un punto de atención especializado para la regularización de trámites ambientales, con el objetivo de garantizar que las actividades comerciales y urbanas se desarrollen en cumplimiento de la normatividad vigente y en armonía con el ent
ADNSureste.info
Gasto en el estado rebasa la media nacional identificada
Diario.mx
Se esperaba su renuncia antes de su toma de posesión como la 57.ª gobernadora del estado el 20 de enero.
Telemundo 47
Organizar una escapada con tus mejores amigos es una de las experiencias más gratificantes que pueden vivir juntos. Elegir bien los lugares para viajar con amigos marcará la diferencia entre unas vacaciones más y una aventura que recordarán toda la vida.
Lado.mx
En un mundo cada vez más digital, contar con una conexión a Internet rápida y estable es indispensable.
Lado.mx
En un país donde las calles hablan más fuerte que los comerciales de televisión, la publicidad tradicional empieza a quedarse sin voz.
Lado.mx
Organizar una escapada con tus mejores amigos es una de las experiencias más gratificantes que pueden vivir juntos. Elegir bien los lugares para viajar con amigos marcará la diferencia entre unas vacaciones más y una aventura que recordarán toda la vida.
Lado.mx
Este sábado 22 y domingo 23 de noviembre el Autódromo Hermanos Rodríguez será la capital del perreo ERIC GARCÍA El festival de Reggaetón más grande del mundo hará historia este 22 y 23 de noviembre: El Coca-Cola Flow Fest regresa para dar cátedra de la buena música y el gran ambiente que se […]El cargo ¡Todo listo par
Impacto
Luis Navarro detalló que el paquete fiscal para el ejercicio 2026 contempla recursos por el orden de los 107 mil 887 millones de pesos. La entrada ”Cuidaremos que presupuesto se ejerza con responsabilidad”, resalta Presidenta del Congreso al recibir Paquete Fiscal 2026 se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
¿Cuánto dinero ganó Fátima Bosch en Miss Universo? Esto es todo lo que recibirá tras coronarse La mexicana aseguró, además del reconocimiento mundial, lujos, contratos, exposición y una vida como reina de belleza gcatarinoVie, 21/11/2025 - 00:05
Record
ESPN Deportes
Hilda Castellanos-LanzarinPetróleos Mexicanos (Pemex) descartó la existencia de una toma clandestina en el túnel localizado dentro de un predio de la alcaldía Miguel Hidalgo, Ciudad de México (CDMX), tras una revisión técnica realizada por personal especializado.El hallazgo ocurrió luego de que el miércoles se recibió un reporte ciudadan
Excelsior
ESPN Deportes
Canal Oficial de MhoniVidente
Zócalo Saltillo
Los países caribeños de CONCACAF en el Mundial 2026 Haití y Curazao conmovieron al mundo luego de conseguir su boleto a la fiesta del verano amartinezMié, 19/11/2025 - 16:12
Record
Jesús Velasco Luego de la conclusión de la última Fecha FIFA de 2025 y con ello la definición de 42 selecciones que obtuvieron su pase directo, el organismo rector del balompié mundial publicó el póster oficial rumbo al Mundial 2026, donde destacaban las caras de diversas figuras internacionales; sin embargo, todo terminó en un mal rato tra
Excelsior
El nombre de Paulinho, la gran figura del Toluca, ya suena fuerte en Europa. El estratega de la Selección de Portugal reconoció que el delantero está siendo observado de cerca y que podría entrar en la convocatoria para la próxima Copa del Mundo. El atacante vive un momento histórico en la Liga MX, donde ya […]La entrada Paulinho podrí
Nación Deportes
Se registró una baja en los valores del dólar con respecto a la jornada anterior
Infobae
Este es el comportamiento de la divisa estadounidense durante los últimos minutos de la jornada
Infobae
A ti y a mí nos ha quedado bastante claro eso de que Xbox no es únicamente una máquina que se enchufa a la tele para jugar. Entonces, ¿qué es? En lugar de sacar una revisión intergeneracional, como PS5 Pro, Microsoft se ha dedicado a explicar que tu móvil, tu televisor con un Fi
Vida Extra
Destacó que el México de hoy es el del pueblo que dice: Nunca más racismo, nunca más clasismo, nunca más discriminación, nunca más justicia para unos cuantos. Redacción Los Conjurados Al encabezar el Desfile Cívico Militar Conmemorativo del 115 Aniversario de la Revolución Mexicana, la Presidenta Claudia Sheinbaum Pardo resaltó que la Cu
LosConjurados.mx
La tarde de este jueves 20 de noviembre se registró un sismo de magnitud 2.3 con epicentro en Naucalpan de Juárez, en el Estado de México.
El Financiero
La tarde de este jueves 20 de noviembre, el Servicio Sismológico Nacional registró un sismo en Naucalpan que se percibió en la alcaldía Miguel Hidalgo.The post Reportan microsismo en CDMX: Sismo en Naucalpan se percibe en la alcaldía Miguel Hidalgo appeared first on Chilango.
Chilango.com
Últimas noticias
¡El día que ANTUNA besó el escudo de CRUZ AZUL! #shorts
¡Ni los equipos grandes detienen a la HORMIGA! #shorts
¡El ‘Cuate’ que todos quisieran tener #shorts
¡EXPULSADO! Alexis Vega agrede a Rivero y lo echan #shorts
La marcha de la generación Z y la respuesta del gobierno: Joaquín Marín de do Pingüé (T5 cap. 39)
¿La píldora anticonceptiva causa cáncer? Esto es lo que dice la ciencia
Sheinbaum aclara que no hubo pruebas delictivas contra CIBanco, Intercam y Vector
Sheinbaum critica al PAN y rechaza la violencia como forma de hacer política
Torturan y asesinan a un hombre de cuarenta años de edad al interior de un anexo en Oaxaca
Análisis y Reseña de Sirius B
Enrique Lugo (Bailarín) - Grand Panther Flash
Ademir Alvarado / Amor a mi
Impactos de la inteligencia artificial en la sociedad - En Claro (Transparencia y Derechos))
Fiesta de Culturas Comunitarias 2025 “Yoltlajtoli: Voces Vivas”
VALENCIA le ganó 1-0 a LEVANTE y consiguió un IMPORTANTÍSIMO triunfo | Resumen | La Liga