12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Infobae
El viernes pasado tuvo lugar el Black Friday, poniendo punto y final a varias jornadas de descuentazos en muchas tiendas que, más allá del propio Black Friday, extienden sus campañas incluso durante semanas. Y hoy, lunes posterior a esa fecha, llega una nueva edición del Cyber Mond
3d Juegos
La Amarilla, en la primera edición de la copa del mundo que se organiza en Filipinas, tiene la oportunidad de clasificar a la semifinal tras ser segunda del grupo B
Infobae
Organizar una escapada con tus mejores amigos es una de las experiencias más gratificantes que pueden vivir juntos. Elegir bien los lugares para viajar con amigos marcará la diferencia entre unas vacaciones más y una aventura que recordarán toda la vida.
Lado.mx
En un mundo cada vez más digital, contar con una conexión a Internet rápida y estable es indispensable.
Lado.mx
En un país donde las calles hablan más fuerte que los comerciales de televisión, la publicidad tradicional empieza a quedarse sin voz.
Lado.mx
Julio Scherer Ibarra reaparece tras la renuncia de Gertz Manero a la FGR. Considera que el cambio permitirá fortalecer la procuración de justicia en el país.
El Financiero
En opinión de Mario Sandoval, si bien, México no está al borde de una crisis financiera como la de 1994, sí se encuentra al borde de una crisis estructural.
SDP Noticias
PIEtiempo completo AETDespués de la prórroga VIVIENDOEste es un partido en vivo. hora del estetiempo extra HTMedio tiempo Nottingham Forest contra Brighton y Hove Albion. Liga Premier. 14:05 horas del domingo 30 de noviembre de 2025. Plano de la ciudad. Fuente
Mas Cipolleti
pietiempo completo AETDespués de la prórroga frescoEste es un partido en vivo. hora del estetiempo extra HTmedio tiempo Aston Villa vs Wolverhampton Premier League. 14:05 domingo, 30 de noviembre de 2025 Parque Villa. Fuente
Mas Cipolleti
Eleazar Gómez fuera de La Granja VIP: Público pide su expulsión por supuesto nuevo caso de violencia También es señalado de haber insultado a su compañera en el reality show La Bea gcatarinoMar, 21/10/2025 - 13:37
Record
Gustavo AlonsoUna de las figuras más mediáticas del reality show La Granja VIP, Sandra Itzel, se convirtió en la segunda eliminada del programa de televisión, luego de una tensa gala que mantuvo en vilo a los seguidores del formato.Durante la segunda gala de eliminación, transmitida el domingo 26 de octubre y conducida por Adal Ramones, la act
Excelsior
Fabiola Campomanes, Sergio Mayer, El Patrón y Kim Shantal serán los nuevos peones
Infobae
Laura A. García El Buen Tono Paso del Macho.- En un acto de fe que congregó a familias de 390 niños y jóvenes de este municipio recibieron el sacramento de la Confirmación de manos del obispo de la Diócesis de Córdoba, Eduardo Carmona.Lo anterior, durante una ceremonia celebrada ayer por la mañana en el domo del […]El
El buen tono
Cada vez más jóvenes renuncian antes de dos años en busca de propósito laboral, revela estudio de Indeed; una tendencia que desafía la permanencia tradicional
NotiPress
Alexandro Medrano / Gráficos: Diseño Excélsior El clima del 28 al 30 de noviembre viene variadito, como México mismo.Mientras unos van a sacar la chamarra, otros van a encender el aire acondicionado… y otros nada más van a mirar al cielo preguntándose qué demonios pasa con la humedad.Norte y noreste: llega el frente frío (pero tranqui)
Excelsior
Las mañanas, inician con complicaciones viales importantes en varias entidades de México principalmente las de valle y montaña, donde la humedad arrastrada por la masa de aire queda atrapada. Te decimos qué estados han reportado nieblas densas.El aire húmedo sobre las aguas frías de la Corriente de California, un fenómeno acentuado por las b
Meteored.mx
Conoce todos los detalles de temperatura, lluvia y calidad del aire en Monterrey para hoy.
El Imparcial
Últimas noticias
Nana Calistar: Horóscopos para HOY 1 de diciembre de 2025
Visión Financiera
Cayetano Martínez de Irujo rompe su silencio tras cancelar su luna de miel con Bárbara Mirjan por sus problemas de salud
Espacio Iberia cierra sus puertas en São Paulo (Brasil) tras recibir a 15.000 visitantes en un mes
República Dominicana: cotización de apertura del euro hoy 1 de diciembre de EUR a DOP
Qué hacer el sábado 6 de diciembre de 2025 en París y en Île-de-France, buenas ideas para salir
Programación televisiva del 1 al 7 de diciembre de 2025: nuestra selección de la semana
Un jugador de Battlefield 6 ha aprovechado un fallo con un tanque para protagonizar un momento de cine absoluto
Sheinbaum responde al “zar fronterizo” Tom Homan y la Fiscalía de EE.UU.: “Empiecen por su país”
Advertencia sobre FTX Plus y Fitelín Pro: denuncias masivas por afectar salud en Puebla
Científicos de Corea del Sur descubren una forma de revertir el cáncer
Cereso de Huejotzingo bajo la lupa: Investigan cobro de cuotas y desmantelan red de corrupción
Desplome de avioneta en Valle de Mexicali deja a piloto herido
ORFIS no detectó empresas “fantasmas” en la pasada administración; “se ha manejado erróneamente el término”, dice titular
Vuelven los cortes de luz a Ucrania por ataques rusos en medio del elevado riesgo nuclear