12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Los autos y camionetas que cuesten 550,000 pesos o menos podrían evitar la tenencia el siguiente año. Escucha sobre este y otros temas en Expansión Daily.
Expansión
Panistas y priistas coinciden en que la reaparición de AMLO, lejos de ayudar a la 4T, profundizaría los enconos.
El Financiero
Tras asumir funciones como director de la Unidad de Prevención Social de la Violencia Municipal, José Armando González Murillo dijo que su labor estará concentrada en contribuir en la estrategia de seguridad en lo que corresponde a la prevención de la violencia, a través de un contacto cercano con los diferentes sectores de la sociedad, for
El Siglo de Torreón
Organizar una escapada con tus mejores amigos es una de las experiencias más gratificantes que pueden vivir juntos. Elegir bien los lugares para viajar con amigos marcará la diferencia entre unas vacaciones más y una aventura que recordarán toda la vida.
Lado.mx
En un mundo cada vez más digital, contar con una conexión a Internet rápida y estable es indispensable.
Lado.mx
En un país donde las calles hablan más fuerte que los comerciales de televisión, la publicidad tradicional empieza a quedarse sin voz.
Lado.mx
Con una precisión que podría suscribir el crimen organizado, el seis de diciembre entrarán desde temprana hora camiones a la ciudad; serán recibidos por un motociclista que les abrirá camino y los conducirá a su lugar de estacionamiento. Cada camión traerá pegado en los costados el nombre del Estado que provienen, la mayoría de las […
Plaza de Ármas
Juan David Castilla La alcaldesa de Actopan, María Esther López Callejas, destacó la transparencia de la inversión municipal, que atribuyó a la recaudación local, y ofreció una explicación detallada sobre un compromiso que no pudo concretar: la compra de un terreno colindante al río Actopan. López Callejas aclaró que las obras realizadas
Hora Cero
“La colaboración entre Ernestina Godoy, hoy encargada del despacho en la Fiscalía General de la República y la SSPC será como la que se tuvo cuando la Presidenta Sheinbaum era Jefa de Gobierno en CDMX”, dijo a Joaquín López Dóriga Omar García Harfuch. Explicó que habrá colaboración con las fiscalías estatales, para coordinar las acc
Plaza de Ármas
ESPN Deportes
El mexicano tendrá actividad en uno de los partidos más esperados en la temporada de la Super Liga
Infobae
Agencias México.- La Secretaría Anticorrupción y Buen Gobierno solicitó la destitución inmediata de Javier Tapia Santoyo, secretario de Administración del IPN, tras detectarse presuntas irregularidades en contratos de limpieza dentro del instituto y en adquisiciones médicas durante su gestión como tesorero del ISSSTE. La investigación señ
El buen tono
La presidenta Ariadna Ayala encabezó el arranque del Operativo Guadalupe-Reyes junto a corporaciones federales, estatales y municipales. El despliegue contempla patrullajes permanentes, vigilancia en zonas de alta afluencia y atención inmediata a emergencias, con 280 elementos y más de 35 unidades reforzando la seguridad en la ruta turística. A
Tribuna Noticias
Meganoticias Veracruz
Meganoticias Tuxpan
Meganoticias Tuxpan
Llegó el Spotify Wrapped 2025 y con él sus mejores memes.
SDP Noticias
El Spotify Wrapped resume los hábitos de escucha anuales de los usuarios que forman parte de la plataforma
La Opinión
Enrique LópezLa UEFA Champions League regresa esta semana con la Jornada 3 de la Fase de Liga, una fecha que promete ser clave para muchos equipos que buscan encaminar su clasificación hacia los octavos de final. Con una clasificación cada vez más apretada, la mitad de la fase europea llega con partidos que podrían tranquilamente verse en rond
Excelsior
Si esta Copa EFL hubiera tenido lugar hace un año, tendría un significado completamente diferente para Tottenham y Newcastle United, pero eso no significa que no tenga significado. Las Urracas son los actuales campeones de la competición, mientras que Tottenham también puso fin a su sequía de trofeos al levantar la Europa League, pero ambos
Mas Cipolleti
PIEtiempo completo AETDespués de la prórroga VIVIENDOEste es un partido en vivo. hora del estetiempo extra HTMedio tiempo Newcastle United vs Tottenham Hotspur. Copa Carabao Ronda 4. 20:00 horas del miércoles 29 de octubre de 2025. Parque St. James, Newcastle. Fuente
Mas Cipolleti
Últimas noticias
¿Chicharito al América? Reportan que seguiría su carrera en otro grande de la Liga MX
Precio del dólar este 2 de diciembre en México
Precio del dólar este 2 de diciembre en México
Se asoma la lluvia este martes a Guadalajara
Vinculan a proceso a seis líderes sindicales ligados a extorsión y control ilegal de agua en el Edomex
AMLO acusa que los conservadores sostienen prejuicios racistas y clasistas
Sheinbaum descarta escenarios extraordinarios tras declaraciones de AMLO
Hombre y mujer ej€cut4dosen Potrero Nuevo, Atoyac;Hay una más lesionada
¡Salinismo vive/ ley de aguas sigue!
Fiscal carnal
La vacuna contra la meningitis B llega tras la muerte de un estudiante de 18 años de Pontypool
Rankings de poder de la NFL de la semana 14 de 2025 de PFT
Rankings de poder de la NFL de la semana 14 de 2025 de PFT
Rankings de poder de la NFL de la semana 14 de 2025 de PFT
Rankings de poder de la NFL de la semana 14 de 2025 de PFT