12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Un rumor que ha comenzado a tomar fuerza en redes sociales ha sacudido al futbol femenino mexicano: la posibilidad de que la española Alexia Putellas se convierta en refuerzo de Tigres para la Liga MX Femenil.
Vanguardia.com.mx
El alcalde de Victoria, Eduardo Gattás Báez, puso en marcha el Programa de Apoyos Alimentarios 2026 en el ejido La Misión, beneficiando a 250 familias del área rural para fortalecer el acceso a alimentos básicos
Hoy Tamaulipas
Se fortalecen acciones de beneficio social en prevención, tratamiento y reducción de riesgos y daños con organizaciones especializadas.
Uniradio Informa
China se ha consolidado como uno de los actores más influyentes en el desarrollo de la inteligencia artificial a nivel global.
Lado.mx
La Biblia ha sido durante siglos una fuente inagotable de guía espiritual, esperanza y reflexión para millones de personas alrededor del mundo.
Lado.mx
El bienestar mental es un pilar fundamental de la salud integral, pero con frecuencia se pasa por alto hasta que los síntomas se vuelven difíciles de ignorar. En un mundo acelerado y lleno de exigencias, muchas personas experimentan estrés crónico, ansiedad o agotamiento emocional sin reconocer las señales tempranas.
Lado.mx
Muere en accidente automovilístico el hijo del director general de BBVA MéxicoThe post Muere en accidente automovilístico el hijo del director general de BBVA México first appeared on Acierta.
Zona Roja
El cantante de 17 años confirmó oficialmente su salida de la orquesta de Oscar custodio para asumir nuevos desafíos en Armonía 10.
Infobae
La Liga BetPlay 2026 llega a la capital boyacense este sábado 14 de marzo. Boyacá Chicó recibe a Millonarios en el Estadio La Independencia de Tunja a las 6:20 p. m., en un compromiso donde las realidades opuestas en la tabla se cruzan: el “Embajador” busca consolidar su racha ganadora para meterse al grupo de …
365scores
Que Claude es uno de los mejores chatbots de inteligencia artificial disponibles actualmente, no es novedad. Es cierto que ChatGPT y Gemini suelen acaparar la mayoría de los titulares, pero la herramienta de Anthropic es de lo más top que puedes encontrar hoy en día dentro del sector. Y si estás pensando en cambiarte desde […]Seguir leyen
Hipertextual
Embark Studios ha estado desarrollando Arc Raiders durante muchos años, y durante ese proceso se han cambiado muchas cosas. Desde el giro hacia el extraction shooter hasta las modificaciones de sus sistemas de combate, el estudio sueco ha ido ajustando muchos elementos del juego. Sin
3d Juegos
Sigue el minuto a minuto de la jornada 11 del Clausura 2026 en directo desde el Estadio Olímpico Universitario
Infobae
La Máquina regresa a casa de los universitarios como líder del Clausura 2026.
ESPNdeportes.com
Sigue el MINUTO A MINUTO del partido en CU entre los equipos capitalinos que han forjado una gran rivalidad reciente
Estadio Deportes
El músico de california se presentó en el Auditorio Nacional.
Editorial Aristegui Noticias
Prepara tu cartera, ya que el Vive Latino reveló el elenco que engalanará su edición de 2026. Entre los artistas figuran Lenny Kravitz, The Smashing Pumpkins y John Fogerty, quien fue el vocalista de Creedence Clearwater Revival. Además, Juanes, Love of Lesbian, Los Fabulosos Cadillacs, Cypress Hill, Maldita Vecindad, Trueno, The Mars Volta, To
24 Horas
Gustavo Alonso¿Listo para ver a Banda Machos junto a Maldita Vecindad? El Festival Iberoamericano de Cultura Musical, mejor conocido como ‘Vive Latino’ anunció su cartel oficial.La nueva edición del evento reúne a una amplia gama de artistas nacionales e internacionales que abarcan distintos géneros, desde el rock alternativo hasta la mús
Excelsior
Cuando hablamos de franquicias de ciencia ficción situadas en el espacio podemos remitirnos a los clásicos Star Wars o Star Trek. Pero en el cine y la televisión también se suma otra longeva producción que en su momento posicionó como una de las series más largas de la historia.
Xataka México
Se registró un alza en los valores del dólar con respecto a la jornada anterior
Infobae
Este fue el comportamiento de la divisa estadounidense durante los primeros minutos de la jornada
Infobae
Últimas noticias
La 4T somos gobierno del pueblo: Sheinbaum
Rescata Pachuca un punto de su visita a San Luis
Rosalía pide disculpas: “No estoy en paz con lo que dije sobre Picasso”
Niega candidato del PT ser deudor alimentario
Estudio sugiere que los juguetes con IA pueden representar un riesgo de seguridad para los niños
Más de 860 distritos de la sierra en riesgo por precipitaciones: autoridades refuerzan medidas ante deslizamientos y huaicos
Azucena Calvay celebra tres años de carrera junto a ‘Los rebeldes de la cumbia’ y Caribeños en el Huaralino Internacional
Miguel Méndez: "Va a ser mi primer Mundial y estoy encantado, más con este grupo"
Pronóstico del clima: las temperaturas que se esperan en Madrid este 15 de marzo
YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy
Abogadas colombianas aclararon si hay cárcel para “las amigas que quedan debiendo” dinero y explicaron qué deudas son punibles
Vinculan a proceso a presunto asaltante armado en Rosarito
Yalitza Aparicio y Regina Blandón aparecen en el área VIP de La Cura Fest y se toman selfies con fans
Derrame de hidrocarburos en el Golfo de México: ¿qué playas de Veracruz están afectadas y qué medidas toman las autoridades?
What is the most watched anime in the world right now?