12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El comunicado emitido por el Tesoro estadounidense confirma que el volumen de devoluciones procesadas prácticamente absorbió la totalidad de los impuestos aduaneros cobrados en el mes
El Imparcial
Paola Gárate denuncia amenazas tras revelar su secuestro y la intervención del crimen organizado en elecciones en Sinaloa.
El Congresista
SSPC Sonora alerta sobre fraudes digitales en la compra de boletos y paquetes para el Mundial 2026. Mantente informado y protegido.
El Congresista
Antes de que llegue la retroexcavadora, antes de que se instale el primer andamio y antes de que comience cualquier actividad de obra, hay un elemento que ya debe estar en el sitio: la caseta.
Lado.mx
Si estás intentando consultar el estatus de tu solicitud o recuperar tu número de folio y te topaste con que la página buscador.becasbenitojuarez.gob.mx/folio está completamente desconectada, no estás solo.
Lado.mx
El mercado mexicano de apuestas en línea está experimentando una transformación acelerada. Lo que hace apenas unos años seguía siendo un nicho con un número limitado de operadores locales se está convirtiendo en un escenario competitivo a gran escala con la participación de marcas globales.
Lado.mx
Haití y Escocia debutan en el Mundial 2026: un duelo histórico en el Grupo C tras décadas de ausencia
El Informador
Este sábado la actividad comienza a las 16:00 horas con el primer partido; a las 18:00 horas inicia el segundo de la jornada.La entrada Hoy, en el Jalo Futbolero: Brasil vs. Marruecos y Haití vs. Escocia; consulta el calendario completo de transmisiones se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
La empresa espacial cerró su primera jornada en Nasdaq con un valor de mercado de 2.1 billones de dólares, por encima de economías como España, Australia y México.
El Imparcial
Choque de estilos y urgencia de puntos en el Grupo D
El Informador
Inició formalmente el Congreso del Estado el análisis para evaluar la creación del municipio número 12 de Aguascalientes, correspondiente a Villa Juárez LA PRESIDENTA de México, Claudia Sheinbaum, visitará Aguascalientes este sábado con una agenda breve, pero movida: llegará procedente de Colima, hará escala en tierras aguascalentenses y
Heraldo de Aguascalientes
El evento que celebra el cumpleaños de Carlos III vuelve este 13 de junio con la familia real británica al completo, carruajes históricos, un espectacular desfile militar y la esperada aparición en el balcón de Buckingham Palace
Infobae
La princesa de Gales ha vuelto a dar una de sus lecciones de estilo desde el carruaje del desfile
Infobae
El rey Carlos III no está rodeado de tanta gente como lo estaba la reina Isabel II cuando celebraba este acto tan especial para la Corona
Infobae
Este duelo será determinante en las aspiraciones de ambas selecciones para clasificar a la siguiente instancia de la Copa del Mundo. Conoce cómo sintonizar en vivo
Infobae
Haití y Escocia debutan en el Mundial 2026: un duelo histórico en el Grupo C tras décadas de ausencia
El Informador
Este sábado la actividad comienza a las 16:00 horas con el primer partido; a las 18:00 horas inicia el segundo de la jornada.La entrada Hoy, en el Jalo Futbolero: Brasil vs. Marruecos y Haití vs. Escocia; consulta el calendario completo de transmisiones se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
Morocco and Brazil square off in Quarterfinal action of the FIFA U-17 World Cup. Here’s everything you need to know ahead of kickoff, including how to watch. How to Watch Morocco vs Brazil Date: Friday, November 21, 2025 Time: 10:45 a.m. ET Location: Aspire Zone – Pitch 7, Doha, QAT TV: FS2 Streaming: FOXSports.com, FOX […]
Mas Cipolleti
EAST RUTHERFORD, N.J. -- As Brazil prepare to open their 2026 World Cup against Morocco on Saturday, Vinicius Jr. does not mince words about what his
Deadspin
Brazil will be without the legendary Neymar for its first World Cup group stage match due to a calf injury, Brazilian coach Carlo Ancelotti said on Fr
Deadspin
Últimas noticias
En acción conjunta, Venezuela y EEUU eliminan al ‘Niño Guerrero’, máximo líder del Tren de Aragua
Luto en Reynosa: fallece querido elotero de la colonia Benito Ju?rez
Anuncia Mario Delgado registro para la UnADM desde el 20 de julio
La COPA del MUNDO 2026 dejará MILLONES de TONELADAS de CO2 y RESIDUOS a Suelo Azteca
Madre de familia solicita ayuda para cubrir cirugía de su hija Soli
Saldan deuda histórica con pueblos originarios en el segundo piso de la transformación
¿Por qué BTS y ARMY usan el color morado? La frase de V que transformó un color en símbolo mundial de confianza, amor y conexión con millones de fans
“Qué elegancia la de Francia”: Jóvenes realizan una caminata con trajes del siglo XVI en la estación Hidalgo del Metro para estrenar los candelabros instalados por el Mundial 2026
“Paren, arrepiéntanse o afronten la ira de Dios”: Papa León XIV lanza mensaje a traficantes de migrantes
Asesinan a alcalde de San Miguel Amatitlán en Oaxaca; semanas antes había reportando una emboscada en carretera
Desde la salud digestiva hasta beneficios al corazón: cuál es la súper semilla recomendada por la ciencia
La CNTE mantiene paro en CDMX: así va la protesta de los maestros y su negociación con el Gobierno
Mundial 2026 en VIVO: últimas noticias de hoy, 13 de junio, el minuto a minuto, los partidos de la jornada y las perlitas del día
Centro de Servicios Integrados de Río Piedras cerrará temporalmente por trabajos de mejoras
¡Orgullo nacional! Tres mexicanos lideran el FIFA Power Rankings tras el debut en el Mundial 2026