12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Un avión A330 ha llegado hace esta mañana a la base de Torrejón de Ardoz
Infobae
Ubisoft anuncia un parche gratuito que permitirá jugar Assassin"s Creed Unity a 60 FPS en PS5 y Xbox Series, mejorando la fluidez del parkour y la exploración del París de la Revolución Francesa.Ubisoft ha anunciado una nueva actualización para Assassin"s Creed Unity (2014) que permitirá jugarlo a 60 imágenes por segundo en PS5 y X
Vandal
Consumidores en Estados Unidos eliminaron ChatGPT tras acuerdo de OpenAI con el Departamento de Defensa. Sensor Tower reporta aumento del 295 % en desinstalaciones
NotiPress
Si el banco te rechazó por tu historial crediticio, es normal cuestionar por qué otra institución puede evaluarte distinto. La mayoría asume que el buró de crédito es el único filtro válido para medir responsabilidad financiera. Sin embargo, existen modelos donde el análisis no se basa solo en el pasado, sino en la disciplina demostrada [
Lado.mx
Si estás buscando consejos para reservar vuelos económicos, la buena noticia es que no necesitas fórmulas secretas: basta con combinar anticipación, flexibilidad y un proceso de búsqueda ordenado.
Lado.mx
Shutterstock El seguimiento de tu ahorro para el retiro es fundamental para planificar tu futuro financiero. Es esencial estar al tanto de tu estado de cuenta Afore para conocer cómo crece tu patrimonio a lo largo de tu vida laboral.
Lado.mx
De la redacciónEl Buen Tono La Selección Mexicana de Futbol ya tiene su nuevo “transporte oficial” para el Mundial 2026. En un evento en Monterrey, junto a Viva Aerobus, se presentó el Airbus A320 que trasladará al tricolor en sus próximos viajes, incluyendo su participación en el torneo que coanfitrearán México, Estados Unidos y Canad
El buen tono
Contralínea
Un total de 279 mexicanos han sido evacuados de países del Medio Oriente ante el conflicto bélico en la región, informó la Secretaría de Relaciones Exteriores (SRE). A través de una publicación de redes sociales, la Cancillería detalló que los connacionales fueron sacados por tierra desde Israel, Jordania, Emiratos Árabes Un
Plaza de Ármas
En el sitio fueron hallados más de 3 mil litros de sustancias químicas
Infobae
De la redacciónEl Buen Tono La Selección Mexicana de Futbol ya tiene su nuevo “transporte oficial” para el Mundial 2026. En un evento en Monterrey, junto a Viva Aerobus, se presentó el Airbus A320 que trasladará al tricolor en sus próximos viajes, incluyendo su participación en el torneo que coanfitrearán México, Estados Unidos y Canad
El buen tono
Una famosa serie que triunfó en Italia, Europa y Estados Unidos llegará a Netflix en cuestión de nada. Se llama DOC, contará con la participación de estrellas mexicanas como Juan Pablo Medina y no te la puedes perder. Aquí te dejamos su sinopsis, reparto completo, fecha de estreno y tráiler. ¿De qué trata DOC? DOC […]The post DOC: re
Gluc.mx
Este miércoles 4 de marzo se estrenó DOC, la nueva serie mexicana de drama médico basada en DOC – Nelle tue mani. La historia italiana que en 2020 conquistó a la comunidad en Europa y que ahora está de regreso con un remake en Netflix. La nueva serie mexicana está dirigida por Harold Ariza Cortes, […]The post DOC (Netflix): Calend
Gluc.mx
La llegada de la adaptación mexicana de la exitosa serie DOC a las pantallas en este 2026 ha puesto bajo los reflectores a su elenco internacional. Entre las figuras que más han llamado la atención se encuentra Stephanie Cayo, la talentosa actriz peruana que aporta elegancia y fuerza dramática a esta producción médica. Si quieres […]The
Gluc.mx
Eight members of Cuba"s World Baseball Classic traveling party have been denied entry into the United States, The Athletic reported.,The denied partie
Deadspin
Mets right-hander Nolan McLean has improved following vertigo-like symptoms that put his availability for the World Baseball Classic in doubt. ,McLean
Deadspin
The United States national team routed the Colorado Rockies 14-4 in its second double-digit win of the World Baseball Classic exhibitions on Wednesday
Deadspin
Bernardo Ferreira / AFPLakers derrotaron 112-108 a los Philadelphia 76ers en otra noche magistral para el eterno LeBron James con 29 puntos, siete rebotes y seis asistencias.James, de 40 años, anotó cinco de los últimos siete puntos para asegurar la victoria en el Xfinity Mobile Arena (Filadelfia).Me sentí bien desde la mañana y luego en el pa
Excelsior
The Philadelphia 76ers suffered an ugly loss on Tuesday, but they won"t have much time to dwell on the defeat.,The Sixers will be right back on the co
Deadspin
Philadelphia 76ers rookie VJ Edgecombe will miss Wednesday"s game against the Utah Jazz with a lower back contusion.,Edgecombe sustained the injury on
Deadspin
Últimas noticias
Djokovic predice el regreso de Serena Williams
Adiós a la incertidumbre, conoce las condiciones climáticas en Barranquilla
¿Cómo estará el clima en Cartagena de Indias?
Clima: las temperaturas que predominarán este 5 de marzo en Cali
Washington D. C.: el pronóstico del clima para este 5 de marzo
Clima en EEUU: temperatura y probabilidad de lluvia para Miami este 5 de marzo
Faustino Oro buscará convertirse en el gran maestro más joven en la historia del ajedrez
El auge de la formación en inteligencia artificial impulsa el crecimiento de pequeñas empresas en Nueva York
‘Give Me Everything’ y más éxitos de Bridgerton llegan a este rincón medieval de la CDMX en una experiencia inmersiva única
Pakistán con reservas de gasolina y diesel para 28 días
Capcom lanza el primer parche de Resident Evil Requiem y ocupa 1,4 GB en PC: ¿Qué cambia la versión 1.110.000?
Pobladores protestan por la eliminación de 45 agencias municipales en Altotonga
Mientras EEUU asegura que no ataca a civiles, autoridades iraníes reportan bombardeos contra zonas residenciales, hospitales y escuelas
Martín López Zavaleta es el elegido para reemplazar a Juan Bautista Mahiques como fiscal general de la Ciudad
Guadalajara tendrá nueva app para pagar parquímetros; operará a partir del 14 de marzo