12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Bienvenido a nuestra lista semanal de lo que finalizará esta semana, además de muchas otras ofertas que finalizarán pronto. Hay más de una docena de programas que finalizarán durante la próxima semana, la mayoría de los cuales finalizarán el próximo sábado, ya que es el último día del mes. Las ofertas que vencerán incluyen la […]
Mas Cipolleti
Un juez dictó prisión preventiva oficiosa contra Cesar Alejandro ‘N’, Eder ‘N’ y Esteban ‘N’, por lo que permanecerán en El Altiplano.La entrada Vinculan a proceso a ‘El Botox’ y dos de sus escoltas por delincuencia organizada se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
Susana Barrales expone que la violencia, la exclusión en hospitales y la falta de políticas efectivas siguen poniendo en riesgo a la comunidad trans.
El Imparcial
Para quienes buscan decidir entre iPad y laptop para estudiar, trabajar o hacer tareas diarias, la mejor opción depende de lo que necesites: el iPad ofrece portabilidad y facilidad de uso, mientras que la laptop brinda potencia y compatibilidad con programas más completos.
Lado.mx
Consulta la agenda de encuentros programados para hoy. Los equipos mas destacados se enfrentaran en emocionantes duelos que prometen mantener a los aficionados al borde de sus asientos.
Lado.mx
Elegir una lavadora adecuada representa una inversión importante para cualquier hogar. Con tantas opciones disponibles, determinar cuál es la mejor marca de lavadoras puede resultar complicado si no conoces los criterios fundamentales que distinguen a un modelo de calidad de uno básico.
Lado.mx
Donald Trump afirma que EEUU utilizó un arma secreta llamada “descombobulador” en la operación que permitió la captura de Nicolás Maduro.The post Trump asegura que EEUU usó arma secreta llamada “descombobulador” en operación que capturó a Maduro appeared first on Proyecto Puente.
Proyecto Puente
Serie A: ¿Cuándo y dónde ver el Juventus vs Napoli? EN VIVO El derbi Norte contra sur promete estar lleno de emociones, además de definir la parte alta del campeonato amartinezSáb, 24/01/2026 - 21:38 La Serie A continúa su activi
Record
MUMBAI: Se espera que el Tratado de Libre Comercio (TLC) propuesto entre India y la Unión Europea reduzca drásticamente los aranceles de importación de automóviles, incluidos los vehículos eléctricos (EV), del bloque de 27 naciones al 10-15%, lo que podría impulsar las ventas de vehículos eléctricos de lujo europeos en India. dijo una pers
Mas Cipolleti
Prensa brasileña "advierte" a América sobre el nivel de Raphael Veiga: "No sirve, se acabó" Un medio de Brasil considera que el nuevo fichaje de las Águilas llega en mal momento rtrujillo25Sáb, 24/01/2026 - 07:42
Record
En la temporada 2010-11, Derrick Rose fue el Jugador Más Valioso de la NBA promediando por partido 25.0 puntos, 4.1 rebotes y 7.7 asistencias.
Swingcompleto.com
Cuando Derrick Rose retire su jersey con los Bulls, la franquicia no solo lo celebrará en las gradas, también lo hará en los puestos de comida.
ESPNdeportes.com
En pocos días se estrena Superman, de James Gunn, donde tendremos ocasión de disfrutar de Krypto, el perro con habilidades supercaninas siempre dispuesto a escucharle una pata a Kal-El, al que el célebre director estadounidense dio forma inspirándose en su propio mascota en una his
3d Juegos
Aunque en un inicio nos pareció alguien que puso en peligro a toda la humanidad, Beerus se ha convertido en uno de los personajes más queridos de Dragon Ball Super. Con su pereza y su gula, el Dios de la Destrucción se ganó el corazón de muchos, pero también el odio de otros tant
Vida Extra
Los seguidores de Dragon Ball Super llevan mucho tiempo esperando el regreso del manga. Como sabéis, tras el fallecimiento de Akira Toriyama en marzo de 2024, la obra entró en un extenso hiato, solo interrumpido por la publicación de un capítulo hace unos meses que, aunque aportaba
3d Juegos
Ricardo LaraEl Instituto Mexicano del Seguro Social (IMSS) ha hecho oficial la planificación financiera para la población pensionada del país de cara al ejercicio 2026. A través de la Dirección de Prestaciones Económicas y Sociales, la dependencia estableció las fechas definitivas en las que millones de beneficiarios verán reflejada su mens
Excelsior
¿Ya sabes cuándo te pagan la Pensión IMSS en 2026? Conoce las fechas oficiales Conoce las fechas exactas de depósito para planear mejor tus ingresos durante todo el año lreyesSáb, 13/12/2025 - 19:38 El Instituto Mexicano del Segu
Record
El ajuste en la fecha del pago de la pensión IMSS se debe a la combinación de dos días no laborables al inicio del mes
El Informador
Últimas noticias
El juego en turno
Capitalismo obsceno
El botín
ENTREVISTA ¬ Hay que desmilitarizar al crimen para pacificar el país: Pérez Ricart
El combate a la corrupción está en otro lado
EU vive horas de furia por el asesinato de enfermero, en manos de la policía de Trump
Fallece el historiador Juan Toscano García de Quevedo
Trump ordena abrir Guantánamo para detener a migrantes ilegales
Atacan a balazos a conductor en Mazatlán
Conoce cuánto debes del predial desde tu celular
PAN Jalisco, en contra de elección judicial local en 2025
Participa Chihuahua en la Reunión Nacional de Organismos Estatales de Desarrollo Municipal 2025
Prevén fuertes vientos y descenso de temperatura para las próximas 72 horas
Presenta SEyD acciones prioritarias en materia educativa y deportiva
Captura AEI a un probable agresor de mujer en la colonia Díaz Ordaz