12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El documento servirá como una herramienta estratégica para impulsar políticas públicas orientadas a la competitividad, la innovación y la atracción de inversión.
Uniradio Informa
Hermosillo, Sonora.– La Fiscalía General de Justicia del Estado de Sonora (FGJES) informó la detención de un sujeto presuntamente relacionado con la privación ilegal de la libertad y robo en perjuicio de un hombre de 55 años, ocurridos la mañana de este viernes en el centro de Hermosillo. De acuerdo con los primeros reportes, tres […]
Proyecto Puente
El Servicio de Administración Tributaria (SAT) entregará un total de 500 millones de pesos en premios.
Uniradio Informa
Traditional mining often comes with high entry barriers, steep costs, and complex technology, leaving countless everyday people on the sidelines. But now, a genuine wealth opportunity for the masses has arrived! #SmartMining
Lado.mx
La respuesta a cuál es la mejor tarjeta de crédito en línea depende completamente de tu perfil financiero, tus hábitos de consumo y tus objetivos. Algunas personas priorizan el cashback, otras buscan meses sin intereses, y hay quienes necesitan una opción sin comprobar ingresos.
Lado.mx
La digitalización de pagos ha transformado el panorama comercial. Con más de 5 millones de terminales activas en el país y un mercado que alcanzará los 2.73 mil millones de dólares para 2030, convertirse en distribuidor de terminales POS representa una oportunidad sólida para emprendedores. Este modelo permite generar ingresos recurrentes mie
Lado.mx
Meganoticias Tuxpan
Un sujeto relacionado con trabajos para TV Azteca y Netflix fue detenido al intentar degollarse tras matar a una mujer en un inmueble de la alcaldía Álvaro Obregón.La entrada FEMINICIDIO: Samuel trabajó para TV Azteca y Netflix; ayer mató a Daniela en su casa se publicó primero en Afondo Noticias.
A Fondo Estado de México
En París y en otros lugares, los cafés y restaurantes que admiten perros son cada vez más populares. Estas buenas direcciones dan una cálida bienvenida a los perros, al tiempo que ofrecen un capricho gourmet a sus dueños, para un momento de convivencia que compartir.
Sortiraparis
TUDN México
Llevamos siete años con un magro crecimiento económico. La perspectiva no mejora. El sexenio de Andrés Manuel López Obrador promedió 0.9 por ciento. Insuficiente para cubrir las necesidades de un país de más de 130 millones de almas.Este año difícilmente alcanzaremos el modestísimo 1.2% que pronosticó la presidenta Claudia Sheinbaum en s
Excelsior
El presidente de Estados Unidos, Donald Trump, anunció este miércoles desde Corea del Sur que su gobierno iniciará de inmediato pruebas con armas nucleares, en respuesta al reciente ensayo ruso de un dron submarino con capacidad atómica. El anuncio, realizado durante su participación en la cumbre del Foro de Cooperación Económica Asia-Pacíf
Canal 44
Los máximos ganadores en la historia de la NBA: Oklahoma City Thunder es Campeón Primer título en la historia de la franquicia para meterse en la historia de los ganadores de oro en la NBA adminrecordDom, 22/06/2025 - 22:45
Record
The surprising Chicago Bulls have been searching for a star player since trading away Zach LaVine last season. They may have found one in second-year
Deadspin
Antonio Velázquez La NBA comenzó un camino en México en el que ha dejado gratos momentos marcados por jugadores que alcanzaron sitio entre las leyendas desde el primero de los juegos oficiales de la liga el 27 de octubre de 1992, cuando con la franquicia de los Rockets figuraba Hakeem Olajuwon, uno de los centros más destacados de todos los tie
Excelsior
El béisbol de las Grandes Ligas está de vuelta con el primer juego de la Serie Mundial entre los Dodgers de Los Ángeles y los Blue Jays de Toronto, el famoso “Clásico de Otoño” que reúne a los campeones de la Liga Americana y la Liga Nacional.El juego que enfrenta al conjunto angelino con la escuadra canadiense está cargado de historia y
El Siglo de Torreón
Oswaldo RojasEl primer ministro, Mark Carney, dijo el viernes que Canadá está dispuesta a reanudar las conversaciones comerciales con Estados Unidos, que el presidente Donald Trump interrumpió en la víspera por un anuncio contra los aranceles difundido por el gobierno provincial de Ontario.El mandatario estadunidense puso fin a las conversac
Excelsior
Los Angeles Dodgers vs Toronto Blue Jays EN VIVO Serie Mundial MLB 2025 Juego 1 Sigue EN VIVO las acciones más importantes del primer partido del Clásico de Otoño m.zavalaVie, 24/10/2025 - 17:50
Record
Oficial: Sarah Luebbert renueva con América hasta 2029 La estadounidense retomó actividad luego de la lesión sufrida ante Pachuca DavidTASáb, 11/10/2025 - 13:58
Record
Carolina Jaramillo rescató empate de Chivas contra Puebla El Rebaño sufrió pero logró una igualada que le da su boleto a la Liguilla aspindolaDom, 12/10/2025 - 12:35
Record
Liga MX Femenil: Equipos clasificados a Liguilla del Apertura 2025 Ocho equipos quieren pelear por levantar el título a final de temporada rtrujillo25Dom, 12/10/2025 - 16:01
Record
Últimas noticias
¿Cuál es el origen del pan de muerto?
EEUU parece aumentar presión militar en el Caribe
¿Dónde poner la flor de cempasúchil además de la ofrenda de Día de Muertos?
Veracruz presente en el Grand Prix Nacional de Luchas Asociadas
Arrestan a joven por fumar mariguana en vehículo y resistirse al arresto
Hombre fallece tras caer desde un cerro en la colonia Las Haciendas
NFL multa a los Ravens por error de participación de Lamar Jackson
Pachuca vibra con terror en vivo: Luis Felipe Tovar y Ana Claudia Talancón en el sótano
influencer Fernanda Maroca muere a los 30 años en Lago Verde, presunto suicidio
Renuncia pelotero venezolano MLB con 6 años de experiencia
Presentan en Cancún a empresario sancionado por EU por tráfico de personas
Michoacán publica mecánica operativa del apoyo complementario al precio del maíz: Sader
“Buu en el Zoo” llena de magia y diversi?n a cientos de familias en Ciudad Victoria?
Anthony Davis se perderá el duelo de la Ciudad de México 2025 ante Pistons
¿Tiene la infraestructura de almacenamiento de datos adecuada para respaldar su estrategia de IA?