12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El gobierno federal inició la distribución escalonada de los pagos bimestrales de las Pensiones para el Bienestar
Infobae
Los fenómenos meteorológicos y análisis de probabilidad permiten dar información sobre la temperatura, lluvias y vientos para las próximas horas
Infobae
Infobae
En un mundo que se mueve cada vez más rápido, encontrar un espacio de calma se ha vuelto una necesidad fundamental. El yoga no es solo una disciplina física, es una herramienta integral que transforma la relación entre el cuerpo y la mente.
Lado.mx
El problema del progreso sin control En el mundo del fitness moderno, uno de los mayores errores no es la falta de esfuerzo, sino la falta de control sobre el proceso. Muchas personas entrenan intensamente, siguen dietas estrictas y buscan resultados rápidos sin entender cómo responde realmente el cuerpo.
Lado.mx
La compañía presenta una nueva solución diseñada para mejorar la ergonomía en entornos de trabajo flexibles, integrando funcionalidad, diseño compacto y conectividad en un solo dispositivo. Colebrook Bosson Saunders ha anunciado el lanzamiento de LANA, un soporte ergonómico para laptops concebido para responder a las nuevas dinámicas del tr
Lado.mx
El gobierno federal inició la distribución escalonada de los pagos bimestrales de las Pensiones para el Bienestar
Infobae
El Mundial de futbol 2026 emerge como una cita de dimensiones inéditas en la historia del deporte. Con la convergencia de Estados Unidos, México y Canadá como sedes, la competición presenta 48 selecciones y un total de 104 partidos, lo que obliga a repensar calendarios, logística y propuestas tácticas. La ampliación
Sport Judge
Grand Theft Auto VI marcará un antes y un después en la historia de los videojuegos, tanto para bien como para mal. Se asume que establecerá nuevos baremos y estándares en todos los sentidos: calidad gráfica, del rendimiento y la jugabilidad, cantidad y tipo de contenido pre/postl
Vida Extra
La recta final de la Premier League no da tregua. Este lunes 4 de mayo de 2026, Everton vs Manchester City se miden en el Hill Dickinson Stadium por la jornada 35 del certamen inglés. Mientras los “Citizens” de Pep Guardiola pelean palmo a palmo por el liderato del campeonato, los “Toffees” buscan cerrar la …
365scores
Las autoridades revelaron la razón por la que el sujeto mexicano viajó de Sinaloa hasta Colombia
Infobae
También exhortaron a reducir los niveles de inseguridad que, en muchas ocasiones, desalientan a las y los interesados a integrarse a las academias de policía
El Informador
El Financiero Bloomberg TV
La Real Academia Española tiene como principal función el velar por la lengua española ante su continua adaptación a las necesidades de los hablantes
Infobae
Willito y Lonche llegan a La Mansión VIP tras su pelea en Supernova. Te explicamos quiénes son y por qué están en tendencia
Debate.com.mx
La recta final de La Mansión VIP ya comenzó, marcando el cierre de un reality creado por HotSpanish que se transmite en vivo las 24 horas a través de YouTube.A lo largo de varias semanas, el programa logró captar la atención del público gracias a sus dinámicas de convivencia, nominaciones y votaciones mediante superchat. Sin embargo,
El Siglo de Torreón
Eli Esparza es una influencer que se volvió tendencia por La Mansión VIP. Conoce su historia, carrera y cómo votar para apoyarla en el reality
Debate.com.mx
En México, el registro nacional de telefonía móvil busca que cada línea esté asociada a una identidad real y su objetivo principal es combatir delitos como la extorsión y fraudes
Infobae
Esto aplicará para todas las compañías telefónicas que operan en México, incluyendo a Telcel, AT&T y Movistar, tanto en planes de prepago como pospago.
El Imparcial
Esta nueva regulación representa un cambio importante en el sector de las telecomunicaciones
El Informador
Últimas noticias
Hilma af Klint en el Grand Palais: una exposición entre espiritismo, ocultismo y abstracción
Una fiesta gratuita de los años 80 en pleno París, con concierto y disfraz. Se abren las inscripciones
El futuro de Mortal Kombat en el cine está casi decidido y hay alguien trabajando en ello desde hace tiempo: "Quiero que sea la mejor de todas"
Mirador 05/05/2026
Economía de México extiende su estancamiento: IMEF
Vende figuritas del Mundial en su taxi para ayudar a sus hijos a completar el álbum
Sumar y Podemos acusan a Ayuso de querer "dinamitar" las relaciones con México a través de su "infame" agenda de actos
El Sevilla solo ganó esta temporada dos partidos seguidos en una ocasión
El Gobierno aprueba que niños sean escuchados en juicios y refuerza protección ante el maltratador: "Os pedimos perdón"
Cómo se encuentra la calidad del aire en la CDMX y Edomex
La alero neerlandesa Laura Westerik ficha por el CAB Estepona
Ibon Navarro asume que su equipo "no es favorito"
Cirujanos logran que paciente recupere la movilidad tras extirpar tumor cervical de alto riesgo
El argentino Juan Saco se va del Cajasol Proin para fichar por el Cisne pontevedrés
Bruselas aprueba que España amplíe las compensaciones a industria que paga por emitir CO2