12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El presidente Donald Trump reprochó la difusión de un presunto listado de peticiones para el alto al fuego con Irán; asegura fueron inventados
SDP Noticias
En los últimos años, XL Games ha intentado hacerse un hueco dentro de los multijugadores como servicio mientras trabajaba en proyectos algo más ambiciosos como el esperadísimo ArcheAge Chronicles. Sin embargo, la trayectoria de los surcoreanos ha ido creciendo en cuanto a ambición
3d Juegos
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
Para la Noche de los Museos 2026, el Museo Paul Belmondo, situado en Boulogne-Billancourt, en los Hauts-de-Seine (92), nos invita a descubrir sus colecciones de forma gratuita, durante una nocturna excepcional, el sábado 23 de mayo de 2026.
Sortiraparis
La nueva disposición que defiende es que, sin orden judicial, se puedan congelar cuentas ciudadanas por “indicios” de posibles delitos. No hay defensa. Es un arma política.
El Financiero
Conflicto entre Estados Unidos, Israel e Irán dispara precio de turbosina; aerolíneas prevén aumento en tarifas ante presión en costos y volatilidad global.
El Financiero
Analizamos a fondo la eficiencia del Nissan X-Trail e-Power en condiciones reales de manejo para determinar si su avanzada tecnología eléctrica realmente se traduce en ahorro para tu bolsillo
Debate.com.mx
¿Cuándo se presenta la obra ‘Peter Pan’? La propuesta de Tonatiuh Gómez y Septime Webre tiene programada una función este 17 de abril en el Auditorio Nacional.
El Financiero
La joya, valorada en $3,000, pertenece a una mujer de 98 años, según la Policía
El Nuevo Día
Mónaco, 9 abr (Prensa Latina) El brasileño Joao Fonseca venció hoy por 6-3 y 6-2 al italiano Matteo Barretini y clasificó a los cuartos de final del Masters 1000 de tenis de Montecarlo.The post Brasileño Fonseca a cuartos de final en Master de tenis de Montecarlo first appeared on Noticias Prensa Latina.
Prensa Latina
AUGUSTA, Ga. -- The 90th edition of the Masters Tournament officially began with the honorary starting threesome of Jack Nicklaus, Gary Player and Tom
Deadspin
Por si no te habías enterado, la popular serie Malcom el de en medio regresará con una temporada nueva este 09 de abril de 2026. Tuvieron que pasar 20 años para volver a ver a una de las familias más icónicas de la televisión, pero si eres de los que no ha visto la serie original
Xataka México
As por la educación: revive el EXATEC Blue Open Golf Tour 2026 (FotosericarreraLun, 02/23/2026 - 13:34 Tiempo estimado de lectura: 2 mins La décima edición del evento rompió su récord histórico con más de 170 jugadores y 300 visitantes
Conecta.tec.mx
En marzo de 2016, AlphaGo se enfrentó a Lee Sedol en Seúl durante cinco partidas y se llevó la victoria gracias a un aplastante 4-1, un evento que tuvo casi el mismo seguimiento que una final mundial. Aquí, lo más relevante del duelo es que Go es un juego imposible para la IA clá
3d Juegos
Alumno leonés rompe barreras de edad en la cienciaA00573190Sáb, 02/28/2026 - 10:03 Read time: 5 mins Alumno de PrepaTec León, realizó a sus 14 años una investigación que evalúa integrales complejas con menor costo computacional Maurizio Estefano Mendoza Martínez, alumno de segundo semestre de PrepaTec camp
Conecta.tec.mx
El fraile francés Jean-Claude Chupin, OFM, cofundador de la Comunidad del Cordero, falleció a los 95 años el pasado 5 de abril, Domingo de Pascua, en Saint-Pierre, la casa madre de la Orden en Francia. Nacido el 29 de septiembre de 1931, fundó en 1981 junto con la “hermanita Marie” esta asociación pública de fieles […]The post Falle
MPV
El fraile francés Jean-Claude Chupin, OFM, cofundador de la Comunidad del Cordero, falleció a los 95 años el pasado 5 de abril, Domingo de Pascua, en Saint-Pierre, la casa madre de la Orden en Francia. Nacido el 29 de septiembre de 1931, fundó en 1981 junto con la “hermanita Marie” esta asociación pública de fieles […]The post Falle
MPV
Hoy en día las adaptaciones de videojuegos son la gran tendencia en la industria cinematográfica. Minecraft, Zelda, Mario Bros y Five Nights at Freddy"s son ejemplos de este auge en popularidad. Pero antes de todas ellas, vio la luz la versión live-action de uno de los juegos d
Xataka México
Últimas noticias
Esta semana se estrena la que puede ser la peli de acción más rara del año, y te la recomiendo
Agente: Enzo Fernández no debió haber hablado de Real Madrid
Ingram Micro y Newland AIDC apuestan por el canal con margen, especialización y proyectos de automatización
La docente Tec que lidera iniciativa enfocada en apoyar el Plan México
Vinculan a proceso a presunto violador de niña; resulta embarazada
El mundo que no alcanzo Julio Scherer Garcia
Se fortalecerá la soberanía energética: CSP
Simulacro Nacional 2026: cuándo y a qué hora sonará la alerta sísmica en altavoces y celulares
Continuarán lluvias fuertes, calor extremo y evento de mar de fondo en Oaxaca: Protección Civil (08:02 h)
Europa exige que el alto el fuego incluya al Líbano para evitar el colapso de la tregua
Almodóvar confía en que Cannes rompa el silencio político de los Óscar
Sarkozy califica su paso por prisión como una deshonra para Francia
“Los videojuegos están acabados”: la dura advertencia del fundador de la desarrolladora, No More Robots, sobre la IA en Steam
Racing quiere seguir arriba y los grandes no quitan el ojo de la Libertadores
La Cámara de Diputados de México aprueba el "plan B" de la reforma política y electoral de Sheinbaum