12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
La presunta duplicidad de funciones de un funcionario educativo vuelve a encender cuestionamientos en el oriente de Yucatán. Se trata de Benigno Ramírez, quien actualmente labora en el Colegio de Bachilleres (Cobay) de Dzemul y al mismo tiempo se desempeña como director de la Preparatoria Estatal No. 4 de Cansahcab.The post Entre aulas y políti
Sol Yucatán
No. 21 seed Jiri Lehecka had eight aces while producing a 7-6 (1), 7-5 victory over Spanish qualifier Martin Landaluce on Wednesday to advance to the
Deadspin
*La BUAP será sede de una jornada de vacunación este 26 de marzo, con atención de 09:00 a 16:00 horas para la comunidad. Puebla, Pue.- Este jueves 26 de marzo […]The post Realizan jornada de vacunación en la BUAP este 26 first appeared on Cinco Radio.
Cinco Radio
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
En el competitivo mundo de la manufactura y los procesos industriales a gran escala, mantener la temperatura bajo un control estricto ha dejado de ser una simple opción para convertirse en una necesidad operativa innegociable.
Lado.mx
Una de las dudas que rodea el debut del naturalizado mexicano con el Tricolor es el número que portará en su primera convocatoria oficial.
El Imparcial
Autoridades y sector salud pusieron en marcha una jornada preventiva con brigadas, fumigación y acciones comunitarias para reducir riesgos y promover la participación ciudadana
Hoy Tamaulipas
La actriz japonesa Anri Sakaguchi fue detenida en Tokio tras presuntamente robar un sándwich de bajo costo. Esto es lo que se sabe del caso.
El Imparcial
Ambas plataformas deberán pagar 3 millones de dólares en concepto de indemnización por daños morales y otros perjuicios económicos.
El Financiero
MICHOACÁN.- La Asociación de Productores de Plátano de Coahuayana, Michoacán, expresó su pesar por el fallecimiento de un destacado integrante del sector agrícola, cuya trayectoria fue reconocida por su compromiso, trabajo y aportaciones al desarrollo de la actividad platanera en la región. La información fue publicada por la propia organiz
AF Medios
A principios de marzo, autoridades municipales del sur de Veracruz se quejaron por la presencia de chapopote en las playas, afectando a la fauna, manglares, lagunas, así como actividades como…El cargo El derrame que nadie sabe de dónde vino apareció primero en Mundo Ejecutivo.
Mundo Ejecutivo
El Samsung Galaxy A57 5G fue presentado por Samsung como el nuevo referente de su gama media para 2026
Merca2.0
El Samsung Galaxy A57 5G fue presentado oficialmente por la marca de tecnología coreana
SDP Noticias
Advierte riesgos de retroactividad y omisiones relevantes en el dictamenLa nota Denuncia PRI riesgos en ley contra pensiones doradas apareció primero en Quadratín México.
Quadratín México
México.- En la sesión vespertina de la Cámara de Diputados, la diputada Haidyd Arreola López y el diputado Manuel Vázquez Arellano, de la Comisión de Puntos Constitucionales, fundamentaron el dictamen a la minuta con proyecto de decreto por el que se reforma el artículo 127 de la Constitución Política, sobre el límite a las jubilaciones &
Elarsenal.net
Aunque todos los grupos parlamentarios avalaron en lo general la propuesta por la presidenta, al ser una aplicación retroactiva de una ley, buscarán, dicen, que no afecte a los trabajadores jubilados que no reciben esas abundantes pensiones.
El Financiero
En un emocionante encuentro disputado en el Cologne Stadium, Bélgica logró su primera victoria en la Eurocopa al vencer 2-0 a Rumania, manteniendo así sus opciones de alcanzar los octavos de final. Con goles de Yuri Tielemans y Kevin De Bruyne, los “Diablos Rojos” consiguieron tres valiosos puntos que los posicionan en el segundo lugar del G
Vanguardia.com.mx
Sin Embargo
El conjunto de Las Estrellas y Lunas choca ante los Tricolores con el objetivo de colarse a la Copa del Mundo.
Foxsports.com.mx
Últimas noticias
Después del «infarto» y un «ligero desbordamiento», viene un derrame de hidrocarburo «en forma de goteo…de manchas», para Nahle
Gobierno de México «no sabe» quién es el responsable del derrame de hidrocarburo; MC amplía denuncia penal y exige a Nahle reaccionar ante la gravedad
Prosa aprisa/Arturo Reyes Isidoro
Claroscuros/José Luis Ortega Vidal
Celebración del papel de las mujeres en el cambiante sector financiero
El viento y las olas ponen en aviso a siete CCAA, con Baleares, Cataluña y C.Valenciana en nivel naranja
El exalcalde de Taipéi, condenado a 17 años de prisión por corrupción y soborno
Georgia acusa a UE de promover campaña contra la Iglesia Ortodoxa y promete fortalecerla
El rendimiento del bono japonés a dos años toca máximos de tres décadas
Nintendo sigue de fiesta con Super Mario y le regala un juego para disfrutar en compañía
La avena: un alimento saludable que exige precauciones en enfermedades renales
El líder militar de Madagascar nombra un nuevo Gobierno y advierte contra la corrupción
Francia convoca G7 excepcional de Finanzas, Energía y Bancos Centrales el lunes próximo
Joseph Woll"s 40 saves help Leafs eliminate Rangers
Jamal Murray explodes for 53 as Nuggets hold off Mavericks