12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Las autoridades realizarán un monitoreo estricto de la salud de los estudiantes, docentes y personal que pudieron haber estado expuestos
Infobae
En pleno corazón del valle de la Vaucouleurs, el pueblo de Septeuil oculta un vestigio raro de la Galia romana: un ninfeo monumental. Erigido para rendir culto a una fuente sagrada, este santuario antiguo ofrece un testimonio excepcional sobre los ritos de devoción vinculados al agua en Île-de-France.
Sortiraparis
La medida afecta a figuras relevantes del ámbito político, entre ellas el alcalde Onursal Adigüzel, como parte de un proceso judicial centrado en prácticas ilícitas que generó reacciones del partido opositor y sus seguidores
Infobae
FTMining ha lanzado recientemente una nueva aplicación móvil, lo que sin duda representa una buena noticia para los usuarios de minería en la nube.
Lado.mx
Este cambio está ayudando a que BM Blockchain destaque como una plataforma construida en torno a la accesibilidad y la conveniencia. Los nuevos usuarios que se registren pueden recibir un bono de bienvenida de US$118, lo que les brinda una razón adicional para explorar la participación cripto mediante un modelo diseñado para reducir gran parte
Lado.mx
La compañía presenta una nueva solución diseñada para mejorar la ergonomía en entornos de trabajo flexibles, integrando funcionalidad, diseño compacto y conectividad en un solo dispositivo. Colebrook Bosson Saunders ha anunciado el lanzamiento de LANA, un soporte ergonómico para laptops concebido para responder a las nuevas dinámicas del tr
Lado.mx
El presidente ucraniano alertó sobre retrasos en el diálogo internacional y falta de armamento, mientras insiste en que la guerra en su país no puede quedar en segundo plano frente a otros conflictos.
El Imparcial
La Espinita Andy S. K. Brown* Luisa Ma: Buena para un barrido o un trapeado Marcelo Ebrard ya tiene sustituto en Economía Hasta con pistoleros compran medios en Puebla ¡Tan joven y buena para todo… o más bien, para nada! Es Luisa María Alcalde quien en las campañas presidenciales de López Obrador grababa promocionales […]La ent
Índice Político
Brozoxmiswebs
FTMining ha lanzado recientemente una nueva aplicación móvil, lo que sin duda representa una buena noticia para los usuarios de minería en la nube.
Lado.mx
Quito, 23 abr (Prensa Latina) Más de un mes después del fallo de la Corte Constitucional de Ecuador que declaró la desaparición forzada de cuatro niños en el caso Malvinas, varias de las medidas de reparación ordenadas al Estado siguen hoy sin cumplirse.The post Ecuador mantiene pendientes medidas de reparación por caso Malvinas first appear
Prensa Latina
La Sonora Dinamita llega a La Maraka este 23 de abril. Te damos el setlist, horario y telonero de su concierto
SDP Noticias
El bueno de Peter Parker volverá este verano a los cines con Spider-Man: Brand New Day, una película que, por distintos motivos, ya empieza a sonar a cierre de ciclo para muchos fans. No son pocos los que perciben este nuevo capítulo como la posible despedida de Tom Holland del pers
3d Juegos
Checa los detalles sobre la película de Michael Jackson con Jaafar Jackson, cuál es el soundtrack y todo para que te vayas preparando.The post ¿Vale la pena ver la película de Michael Jackson? todo sobre la biopic con Jaafar Jackson appeared first on Chilango.
Chilango.com
La película ‘Michael’, sobre Michael Jackson, debuta con baja calificación en Rotten Tomatoes y críticas que la señalan como superficial.
El Imparcial
«Ya nomás falta que le ponga oficina» la rectora a Raúl Morón que «está adelantando campaña política y se la pasa encerrado con Yarabí», acusó sobre el aspirante gubernamental morenista Para el líder del Sindicato Único de Empleados de la Universidad Michoacana, Eduardo Tena Flores, la politización en que está sumergida la instituci
Respuesta.com.mx
Francisco y Eduardo Mendoza obtenían drogas sintéticas de una fuente ligada al grupo criminal
Infobae
La Universidad Anáhuac presentó dos grandes eventos deportivos que promueven la convivencia de la comunidad en la institución; se trata de la 14ava. Carrera Zibatá – Anáhuac y el Torneo de Golf 2026. El rector Luis Eduardo Alverde señaló que estos eventos buscan fortalecer la convivencia entre la comunidad Anáhuac, incluyendo estudian
Plaza de Ármas
Últimas noticias
Libros de ayer y hoy
Balacera en Teotihuacán, otro hecho celebrado por la derecha
El 2027 no se definirá en las urnas
En el ojo del huracán, la aviación nacional y la internacional
Fracking, un daño inadmisible al medio ambiente: la presidenta entreabre la puerta a lo que otros países prohíben
Desbandada y solicitudes de licencia
El asunto de Chihuahua: ¿contravención de la ley, heroísmo o traición?
El mito de los seis años: ¿realmente desaparecen las deudas en el Buró de Crédito?
Fiscalías
Fiesta popular por 300 años del Acueducto
Querétaro en la mira del Verde
Jessica Jones regresa al Universo Cinematográfico de Marvel junto a Daredevil: Born Again
Vehículos nuevos no deben hacer revisión técnico-mecánica en 2026: estas son las excepciones en Colombia
Chats entre Brayan Cruz y alias Gabriela revelan la logística del magnicidio de Miguel Uribe Turbay
Fifpro desacredita al nuevo sindicato apadrinado por AFE porque "carece de legitimidad"