12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
La creatividad ya no se evalúa de forma aislada, sino en función de su capacidad para escalar en medios, adaptarse a múltiples formatos y generar conversiones.
Merca2.0
El huevo es fuente de proteína de alta calidad y tiene un aporte calórico moderado
Infobae
El mercado de remates hipotecarios ha operado durante años entre opacidad y promesas irreales. La inteligencia artificial empieza a cambiar ese terreno.
Merca2.0
En un mundo que se mueve cada vez más rápido, encontrar un espacio de calma se ha vuelto una necesidad fundamental. El yoga no es solo una disciplina física, es una herramienta integral que transforma la relación entre el cuerpo y la mente.
Lado.mx
El problema del progreso sin control En el mundo del fitness moderno, uno de los mayores errores no es la falta de esfuerzo, sino la falta de control sobre el proceso. Muchas personas entrenan intensamente, siguen dietas estrictas y buscan resultados rápidos sin entender cómo responde realmente el cuerpo.
Lado.mx
La compañía presenta una nueva solución diseñada para mejorar la ergonomía en entornos de trabajo flexibles, integrando funcionalidad, diseño compacto y conectividad en un solo dispositivo. Colebrook Bosson Saunders ha anunciado el lanzamiento de LANA, un soporte ergonómico para laptops concebido para responder a las nuevas dinámicas del tr
Lado.mx
De la redacciónEl Buen Tono Reynosa, Tamaulipas.— Autoridades sanitarias del estado investigan un caso sospechoso de infestación por gusano barrenador en una mujer que fue ingresada al Hospital General de Zona No. 270 del Instituto Mexicano del Seguro Social (IMSS), donde permanece bajo atención médica especializada. La paciente presenta un e
El buen tono
Las infancias y adolescentes son un grupo vulnerable ante el uso masificado del internet y las redes sociales Notipress.- Las tecnologías móviles hicieron que el uso masivo del internet alcance a las infancias a una edad cada vez más temprana. En efecto, cobraron importancia como un sector vulnerable a la exposiciónThe post Filtros de edad con
MPV
El primer juego de la serie entre Jalisco y Unión Laguna se fue a 10 entradas, donde los Caporales vencieron 12-11
El Informador
Juan David Castilla El estado de Veracruz encabeza la lista de la Procuraduría Federal del Consumidor (Profeco) tras registrar el costo más elevado de la canasta básica en todo el territorio nacional. Según el monitoreo del Paquete Contra la Inflación y la Carestía (Pacic), un establecimiento en Boca del Río superó incluso el precio meta [&
Hora Cero
KISS, Metallica y Public Enemy rinden homenaje a Eddie de Iron MaidenKISS, Metallica y Public Enemy celebran la figura de Eddie, el icónico mascote de Iron Maiden en documental exclusivo.Este artículo es un contenido original de Monterrey Rock
Monterrey Rock
La Comisión Federal de Electricidad (CFE) emitió un aviso dirigido a las familias mexicanas para que revisen detalladamente su recibo de luz durante mayo de 2026. La dependencia señaló que comprender la información del documento puede ayudar a controlar el gasto doméstico y evitar incrementos inesperados en el pago del servicio eléctrico. La
Seunonoticias.mx
El Hoy No Circula del martes 5 de mayo de 2026 aplica para autos con engomado rosa, terminación de placas 7 y 8, y hologramas 1 y 2 en la CDMX y municipios del Edomex. Hasta el corte más reciente, no hay Doble Hoy No Circula. No hay Doble Hoy No Circula este martes La […]The post Hoy No Circula 5 de mayo 2026: autos que descansan en CDMX y
Seunonoticias.mx
El Hoy No Circula del miércoles 6 de mayo aplica con normalidad en la Ciudad de México y 18 municipios del Estado de México, en medio de la segunda ola de calor prevista para la capital. La restricción busca reducir emisiones contaminantes en la Zona Metropolitana del Valle de México. ¿Qué autos no circulan este […]The post Hoy No Circ
Seunonoticias.mx
Para este miércoles 6 de mayo, el programa ambiental limita la circulación de vehículos con engomado rojo, placas con terminación 3 y 4, y hologramas 1 y 2. La medida aplica ininterrumpidamente de las 05:00 a las 22:00 horas en toda la zona metropolitana. Al no existir contingencia ambiental activa, los autos con hologramas 0 y 00, así como lo
Amexi
#Papantla Con motivo del Primer Simulacro Nacional, este 6 de mayo a las 11:00 a.m. se activará un sistema de alerta como parte del ejercicio, por lo que el sonido se perciba no representa una emergencia real; se invita a la ciudadanía a mantener la calma y atender las indicaciones para fortalecer la cultura de […]The post Este 6 de mayo se
Gráfico Al Día
Este miércoles 6 de mayo a las 11:00 h se activará la alerta sísmica por el Primer Simulacro Nacional 2026 con hipótesis de sismo magnitud 8.2.La entrada Hoy sonará la alerta sísmica: Prepárate para el Primer Simulacro Nacional 2026 se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
A las 11:00 sonará la alerta: todo listo para el Simulacro Nacional 2026azolorioMié, 06/05/2026 - 07:26
NVI Noticias
En la época de reboots, revivals y secuelas tardías, por este mismo afán de la industria cinematográfica por exprimir propiedades intelectuales, estrenó una superproducción considerada una de las películas más caras de la historia. Y si no la pudiste ver en pantalla grande, tie
Xataka México
Desde sus inicios a finales de los 90, One Piece nos ha presentado una infinidad de personajes que han tenido inspiraciones de todo tipo. Los tres almirantes, Enel y otros muchos personajes tienen parecidos muy curiosos con artistas y actores que Oda respeta; sin embargo, hay un caso m
Vida Extra
Bien es sabido la saga Diablo tiene un legado importante —prácticamente un sello propio en la cultura popular— en forma de aquel aquel mítico nivel de las vacas de su segunda parte. Una broma común en los juegos de la década de 1990, pero que aún hoy continúa obsesionando a l
3d Juegos
Últimas noticias
Lula y Trump reactivan diálogo en Washington antes de elecciones en Brasil
Luana Amador remarca apoyo total a personas con discapacidad
García Harfuch confirma detención de 5 delincuentes y un líder criminal en Morelos
Casinos sin verificación: ventaja o trampa legal
Van solos por el presupuesto
SAISUV advierte sobre riesgos y prevención ante golpe de calor
Sorpresivo regreso a Santa Fe para el partido contra Corinthians
Cuando se iba bañar lo ejecutaron en su domicilio
Incendio en vivienda moviliza a cuerpos de emergencia en Orizaba
Detienen a "Los Linos", célula dedicada al traslado de droga a EU
Calor de 45 grados y torbellinos amenazan a México hoy
Miércoles de Plaza en La Comer y Fresko: Ofertas de hoy 6 de mayo
OMS ALERTA por brote de HANTAVIRUS; investigan posible CONTAGIO entre HUMANOS
5 de mayo
La renuncia a Rocha Moya