12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Ciudad de México, 30 de marzo de 2026.- La presidenta Claudia Sheinbaum Pardo acusó que políticos de oposición buscan generar presión desde Estados Unidos para propiciar una intervención extranjera en México. En conferencia, sostuvo que legisladores y actores políticos han recurrido a medios de comunicación estadounidenses para criticar al
El Sur de Acapulco
El camino al Mundial 2026 llega a su momento de máxima tensión. Mañana se juegan las finales de los repechajes y el mapa de la Copa del Mundo quedará finalmente trazado. Selecciones históricas como Italia, Suecia y Polonia se juegan el todo por el todo en 90 minutos, mientras que equipos como Bolivia e Irak …
365scores
Chilpancingo, Guerrero, 30 de marzo de 2026. La secretaria general del Sindicato Único de Trabajadores al Servicio de los Organismos Públicos Descentralizados del Estado de Guerrero y Municipios (Sutsopegm), Guillermina Rodríguez Parra, señaló hoy que fue agredida por guardias de seguridad del gobierno del estado al intentar ingresar a
El Sur de Acapulco
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
La presidenta admitió que inicialmente se negó el hecho, pero una revisión interna confirmó la presencia de una persona en una ventana del recinto
El Sol de San Juan del Río
A edição de 2026 do AnimeJapan registrou público recorde, segundo os organizadores. O evento reuniu 156 mil visitantes nos dias 28 e 29 de março de 2026, superando os 152,4 mil do ano anterior. O crescimento reforça a relevância global da feira dedicada à indústria de anime. Além disso, a convenção contou com mais de […]The post An
Animenew
Uruapan, Mich.- El conductor de un taxi de la organización Linda Vista resultó lesionado al caer a un barranco sobre la carretera «libre» Uruapan-Lombardía.
Red113mx.com
La agencia redirige recursos hacia la creación de una infraestructura industrial lunar, preparando el salto hacia Marte. Las razones analizadas por un experto
Infobae
Si tuviéramos que recomendar un grupo de k-pop a alguien que apenas se asoma a la industria, sin duda sería ENHYPEN. Sus canciones enganchan, te harán...The post Entrevista con ENHYPEN: mazapanes y ENGENE en México appeared first on Sopitas.com.
Sopitas.com
Paola Jiménez Una nueva Pop Up Store de SEVENTEEN tendrá lugar en la CDMX y trae consigo una experiencia esperada por miles de fans del K-pop. La tienda del grupo surcoreano abrirá por tiempo limitado, con la promesa de repetir el éxito de su visita anterior, que dejó recuerdos inolvidables entre Carat.En su edición pasada, los asistentes no
Excelsior
El grupo de K-pop se queda con seis integrantes después de la inesperada salida
Infobae
Los caribeños superaron a Nueva Caledonia en Guadalajara y quedaron a un paso del torneo de la FIFA para el que deberán enfrentar a los africanos, que quieren disputar su primera copa
Infobae
Infobae
Ambas selecciones se enfrentarán en el partido decisivo del repechaje intercontinental rumbo al Mundial de 2026
El Informador
Esta primera mitad de 2026 va a ser —está siendo— bastante movida para los fans de Juego de Tronos. No solo acabamos de disfrutar seis semanas de una calidad soberbia con El Caballero de los Siete Reinos, sino que, a las puertas del verano, tendremos el debut de la tercera tempora
3d Juegos
No hay nada más icónico que Zendaya. Es —nos atrevemos a decir— la actriz más destacada de este 2026, con todos los estrenos que tiene preparados: The Drama, La...The post Rue en (más) problemas: El nuevo tráiler de la tercera temporada de ‘Euphoria’ appeared first on Sopitas.com.
Sopitas.com
HBO lanzó un avance final con estreno previsto para el 12 de abril de 2026
Infobae
Últimas noticias
Bedolla Descarta Que Exfiscal Adrián López Sea Investigado Por Arantepacua
Rosi Bayardo supervisa Puesto de Mando en Miramar; todo listo para recibir a vacacionistas
DETENIDOS TRES PRESUNTOS ASALTANTES DE CUENTAHABIENTE EN CELAYA
Martes 31 de Marzao se presentará el proyecto ejecutivo del cablebus
El enigma de los Clavos de Cristo y su rastro por la historia europea
Four Play
Honra CSP legado de Margarita Maza, Primera Embajadora Histórica de México
Emiliano López Valadez avanza al nacional de boxeo
Cero presencia en redes sociales de Felipe Cervera
¿Rumbo a la Castellana? El guiño de Enzo Fernández que ilusiona al Real Madrid
Desapariciones imparables en la CDMX: suben 57% en 2026
Rebautizan colonia en Tultitlán en señal de protesta contra Morena
ONU advierte: Guerra en Irán agrava la represión interna y las ejecuciones
Banxico recorta su tasa de interés y manda a la baja los rendimientos de los Cetes
MÉXICO cuenta con cerca de 35 BILLONES de pies cúbicos de RESERVAS totales de GAS NATURAL