12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El balance para los franceses en Roland Garros suele ser desastroso. Este año, algunos franceses resisten, entre ellos Moise Kouamé, el jugador más joven en alcanzar la tercera ronda de un Grand Slam desde Nadal.
Sortiraparis
¡Eaubonne está de fiesta! La ciudad del Val-d"Oise les prepara una gran jornada festiva el sábado 20 de junio de 2026, para celebrar por todo lo alto la nueva Fiesta de la Música y la Fiesta de San Juan. Así que pasen por el centro de Eaubonne para disfrutar de un montón de conciertos gratuitos, con la actuación estelar del grupo Les Ye
Sortiraparis
El mitin que CSP encabezará el domingo por los dos años de su elección será transmitido en plazas públicas de los estados, excepto Coahuila.
Reforma
Si estás intentando consultar el estatus de tu solicitud o recuperar tu número de folio y te topaste con que la página buscador.becasbenitojuarez.gob.mx/folio está completamente desconectada, no estás solo.
Lado.mx
El mercado mexicano de apuestas en línea está experimentando una transformación acelerada. Lo que hace apenas unos años seguía siendo un nicho con un número limitado de operadores locales se está convirtiendo en un escenario competitivo a gran escala con la participación de marcas globales.
Lado.mx
En un mundo que se mueve cada vez más rápido, encontrar un espacio de calma se ha vuelto una necesidad fundamental. El yoga no es solo una disciplina física, es una herramienta integral que transforma la relación entre el cuerpo y la mente.
Lado.mx
El Financiero Bloomberg TV
Especialistas del Tec de Monterrey advierten que el fármaco para la diabetes carece de datos de seguridad cuando se usa de forma intermitente para perder peso, y descartan que exista una “solución fácil”
El Informador
LA JORNADA Nueva York. Las fiscales generales de Nueva York y de Nueva Jersey anunciaronThe post Abren investigación contra FIFA por boletos del Mundial 2026 appeared first on Desde Puebla.
Desde Puebla
Un conflicto en Cancún entre un migrante cubano y un ciudadano mexicano desata tensiones en la comunidad.
El Congresista
Mayor inversión y apertura en la industria farmacéutica y biotecnológica posicionan a Argentina como referente internacional en salud
Infobae
El Teatro Bretón de Sepúlveda celebra el certamen "Siete Llaves", con siete obras que destacan el talento del teatro aficionado.
El Congresista
Sudáfrica, selección que se enfrentará a México en la jornada inaugural del Mundial 2026, presentó su convocatoria definitiva de 26 elementos
Tribuna
El cantante Fher Olvera detalló que Maná estrenará una canción de dos minutos en la inauguración del Mundial de Fútbol 2026 en el Estadio Ciudad de México.La entrada Fher Olvera: abrir el Mundial 2026 será un momento “inédito” para Maná y un mensaje de paz se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
El vocalista de Maná, Fher Olvera, aseguró que la participación del grupo en la inauguración del Mundial 2026 será uno de los momentos más importantes en la historia de la banda y destacó que el espectáculo buscará transmitir un mensaje de paz... Nota completa »
Notisistema
Rubén Aguilar Valenzuela El 25 de mayo se publicó Magnifica humanitas, la primera encíclica del papa León XIV, que firmó el 15 de mayo en el 135 aniversario de la promulgación de la encíclica Rerum novarum de León XIII. La encíclica tiene como subtítulo, “Sobre la custodia de la persona humana en el tiempo de …El cargo La primera
El Sur de Acapulco
Un tren y autobuses interurbanos vinilados se suman a las actuaciones previstas en la capital por la visita del Pontífice
Infobae
El deportivo de la marca italiana es capaz de acelerar de 0 a 100 km/h en 2,5 segundos y recorrer más de 530 kilómetros por carga
Infobae
Por su presunta responsabilidad en el delito de robo a negocio sin violencia, fueron detenidos dos jóvenes de 17 y 18 años de edad, quienes intentaron sustraer carne para asar, salchichas y otros productos de un centro comercial de Gómez Palacio.Los hechos ocurrieron cerca de las 19:30 horas el pasado domingo 24 de mayo del 2026 en la tienda Sor
El Siglo de Torreón
La credencial del INAPAM es más que una identificación oficial para los adultos mayores de 60 años, ya que contar con ella les permite acceder a una gran red de descuentos. Entre los más conocidos se encuentran el poder utilizar el transporte de forma gratuita y el descuento en el pago de servicios como el predial y el agua; pero no son los ún
El Siglo de Torreón
Este 25 de mayo arrancó oficialmente el Hot Sale 2026 en México y, como parte de esta campaña de descuentos, Julio Regalado de Soriana lanzó un folleto dedicado a esta campaña
Merca2.0
Últimas noticias
Encabeza Rodrigo Monsalvo conversatorio sobre salud mental para madres, padres y cuidadores
Cielos nubosos y lluvias aisladas: así estará el clima el fin de semana en Guanajuato
Sheinbaum oficializa el Día Nacional del Tequila; México celebrará cada 24 de julio
Golpean a mujer durante robo en Forum Cultural de León; denuncian ineficiencia de autoridades
Manhattanhenge regresa a NYC: ¿Qué es y dónde puedo ver el fenómeno?
Reactivan en Metapa la planta de moscas estériles contra el gusano barrenador
FGJCDMX aumentó 212% judicializaciones contra fraude en 2025: Alcalde
Ante temporada de lluvias morelianos ya se preparan para evitar inundaciones
Paola Ruiz, continúa recorriendo el municipio de Puebla
Menos pobreza laboral… Pero millones siguen sobreviviendo con salarios insuficientes
¿Cuánto deberías ganar para comprar una casa en EE.UU. en junio del 2026?
Llegarán más obras públicas a la Huasteca: Ricardo Gallardo
Guatemala rechaza que vaya a realizar ataques conjuntos con EU contra el narco
Choque frontal en el Viaducto Reynosa dej? dos lesionados
Trasladan desde Ciudad Juárez a paciente con quemaduras graves en el 45% del cuerpo