12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
LaLiga
De acuerdo con el Programa Institucional de Profeco 2026-2030 que se publicó en el Diario Oficial de la Federación (DOF) estas problemáticas no son hechos aislados
Merca2.0
La salida de Alejandra Gutiérrez del PAN no rompe la mayoría panista en León, pero abre tensiones políticas y cuestionamientos desde la oposición sobre posibles actos de corrupción
Infobae
El problema del progreso sin control En el mundo del fitness moderno, uno de los mayores errores no es la falta de esfuerzo, sino la falta de control sobre el proceso. Muchas personas entrenan intensamente, siguen dietas estrictas y buscan resultados rápidos sin entender cómo responde realmente el cuerpo.
Lado.mx
FTMining ha lanzado recientemente una nueva aplicación móvil, lo que sin duda representa una buena noticia para los usuarios de minería en la nube.
Lado.mx
Este cambio está ayudando a que BM Blockchain destaque como una plataforma construida en torno a la accesibilidad y la conveniencia. Los nuevos usuarios que se registren pueden recibir un bono de bienvenida de US$118, lo que les brinda una razón adicional para explorar la participación cripto mediante un modelo diseñado para reducir gran parte
Lado.mx
Tecoluca, El Salvador.- Unos 220 miembros de la Mara Salvatrucha (MS13) escucharon este jueves el estremecedor testimonio de un exintegrante de la pandilla durante el cuarto día del juicio masivo que se desarrolla en el Centro de Confinamiento del Terrorismo (Cecot), la megacárcel de máxima seguridad construida por el gobierno de Nayib Bukele.
Tribuna Noticias
Infobae
Copa América 2015
Lado.mx Trendings
Hubo un tiempo en el que hablar de adaptaciones de videojuegos al cine era casi un chiste interno entre aficionados. Un género maldito, condenado a tropezar una y otra vez con la incomprensión de los estudios y la incapacidad de trasladar la magia interactiva a una narrativa pasiva.
3d Juegos
El Señor de los Anillos no solo es una de las más grandes franquicias cinematográficas de la historia, sino también un cúmulo de pequeños detalles y cameos. Tan así que el propio director, Peter Jackson, apareció en todas y cada una de las entregas. Sin embargo, en esta oc
Xataka México
¡Es oficial! Michael Jackson formará parte de la nueva entrega de Scary Movie 6 y el anuncio se dio a conocer a través del trailer de la franquicia que desde el año 2000 se ha inspirado y burlado de las figuras más grandes de la cultura pop. Pero eso no es todo, también se revelaron […]The post Michael Jackson formará parte de Scary Mo
Gluc.mx
El final se acerca ya de la temporada regular del Torneo Clausura 2026 y el partido entre Gallos Blancos de Querétaro contra La Franja del Puebla marca el inicio de la jornada 17 y última de la campaña. Desafortunadamente, este partido no tiene ninguna trascendencia para la liguilla y ni para la tabla famosa […]La entrada Querétaro
Amexi
Dos de los equipos ya eliminados en el torneo se enfrentarán este viernes en la última jornada.
El Imparcial
La Franja y los Gallos pretenden cerrar su mala temporada con triunfo, de cara a sus vacaciones.
Foxsports.com.mx
De Tabernas a Cabo de Gata, los senderos almerienses recorren paisajes de película, barrancos y pueblos blancos, invitando a descubrir la diversidad natural y la aventura en Andalucía
Infobae
El vehículo Mazda CX30 blanco fue despojado sobre el bulevar San Pedro de Salamanca. La artista pidió apoyo en redes sociales para localizarlo
Periódico Correo
El conjunto blanco afronta una visita exigente en Sevilla condicionado por la presión del liderato y varias ausencias sensibles en su plantilla
El Informador
Últimas noticias
Noche de los Museos 2026 en el ayuntamiento-museo de Bourron-Marlotte (77): un programa familiar
La pala NOX AT10 Genius 18K de Agustín Tapia cae a precio mínimo con una oferta brutal
Un equipo internacional de físicos crea una trampa de luz 2.000 veces más fina que un cabello humano: así se alcanza el límite de los 42 nanómetros
La falta de transparencia de México en protección ambiental preocupa a defensores
El Kamasutra, ¿un libro feminista?
Una agenda movida: Roberto Velasco se ha reunido con estos funcionarios como nuevo titular de la SRE
“Ha sonado el perfil de Ariadna Montiel”, cuenta Citalli Hernández sobre dirigencia de Morena
Estudiantes de la UNAM alistan protestas por problemas de movilidad: pasan hasta seis horas al día en el transporte público
La diseñadora Delia González se inspira en el amor y la inclusión
CIDH recibió récord de peticiones de medidas cautelares y violación de derechos
Maru Campos debe ir a juicio político
El trayecto como condena
La obesidad infantil
De las redes al ring, creadores enfrentan el riesgo en “Supernova Genesis”
Los hombres que (sólo) siguen a otros hombres