12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
TUDN México
Los ingresos por Impuesto Sobre la Renta (ISR) registraron una fuerte caída durante abril de 2026, en un contexto donde los ingresos tributarios también mostraron retrocesos, de acuerdo con datos de la Secretaría de Hacienda.The post Se desploman ingresos por ISR en México: caída histórica en 2026 enciende alertas económicas appeared first o
Proyecto Puente
Infobae
Si estás intentando consultar el estatus de tu solicitud o recuperar tu número de folio y te topaste con que la página buscador.becasbenitojuarez.gob.mx/folio está completamente desconectada, no estás solo.
Lado.mx
El mercado mexicano de apuestas en línea está experimentando una transformación acelerada. Lo que hace apenas unos años seguía siendo un nicho con un número limitado de operadores locales se está convirtiendo en un escenario competitivo a gran escala con la participación de marcas globales.
Lado.mx
En un mundo que se mueve cada vez más rápido, encontrar un espacio de calma se ha vuelto una necesidad fundamental. El yoga no es solo una disciplina física, es una herramienta integral que transforma la relación entre el cuerpo y la mente.
Lado.mx
Infobae
El Comando Sur de Estados Unidos afirmó que la embarcación navegaba por rutas conocidas de narcotráfico y era operada por organizaciones designadas como terroristas
El Imparcial
El entrenador nacional Javier Aguirre quedó molesto por el mal segundo tiempo que dieron los integrantes de la Selección Mexicana ante la de Australia, a la cual superaron en el primer periodo y le hicieron el solitario gol, por lo cual espera mejor contundencia en lo que sigue. “No me gustó que en la […]La entrada Molestia de Jav
Amexi
The Chicago White Sox will be without rookie slugger Munetaka Murakami for four to six weeks due to a Grade 2 strain of his right hamstring, manager W
Deadspin
¿Es recurrente la misma metodología de vulneración y la respuesta oficial?La entrada Gobierno niega hackeo a programas Bienestar se publicó primero en Amexi.
Amexi
CIUDAD DE MÉXICO.— La presidenta Claudia Sheinbaum encabezó la firma para la renovación del Paquete Contra la Inflación y la Carestía (PACIC), en un esfuerzo coordinado por salvaguardar el poder adquisitivo de los sectores más vulnerables y contener las presiones inflacionarias derivadas del entorno financiero internacional. ⇒ El acuerdo,
Índice Político
Ludwig Kaiser, luchador de la WWE que interpreta el papel del "Grande Americano", fue arrestado tras haber sido acusado de agresión física
Tribuna
Los problemas legales de Ludwig Kaiser en Estados Unidos comenzaron a generar consecuencias en México tras difundirse su detención en Florida por un presunto cargo de agresión. Después de conocerse el caso, Lucha Libre AAA Worldwide y Kings League México cancelaron un evento relacionado con “El Grande Americano”.La noticia fue confirma
El Siglo de Torreón
El luchador alemán habría protagonizado una confrontación luego de escuchar comentarios racista dirigidos a su pareja
Infobae
Infobae
Las WAGs más icónicas del Mundial 2026 ya nos tienen completamente obsesionadas. De Tini Stoessel y Ester Expósito hasta Georgina Rodríguez.La entrada De Tini a Ester Expósito: las WAGs más icónicas del Mundial 2026 se publicó primero en InStyle México.
InStyle
El ‘conejo malo’ ha dado su primer espectáculo en la capital española durante su gira ‘DeBÍ TiRAR MáS FOToS’, acompañado de cantantes, futbolistas y actrices
Infobae
Fue muy comentado en su día el caso de Fast & Furious, donde Vin Diesel, Jason Statham y Dwayne Johnson imponían reglas para no quedar jamás como perdedores en sus peleas, obligando a coreógrafos y productores a equilibrar cada golpe para proteger sus egos y su imagen, tal y co
3d Juegos
Para empezar esta historia hay que viajar más de medio siglo atrás y encontrarse con un Luc Besson de diez años que, un miércoles cualquiera, entró en un quiosco, abrió un número de la revista Pilote y descubrió a dos personajes que le cambiarían la vida. Eran Valérian y Laur
3d Juegos
Jason Statham Regresa en Homefront, Ahora Disponble en StreamingEl filme de acción Homefront, protagonizado por Jason Statham, tendrá un nuevo hogar en streaming, reviviendo su éxito tras 13 años.Este artículo es un contenido original de Monterrey Rock
Monterrey Rock
Últimas noticias
Aguirre asegura que ya tiene definida la lista de México para el Mundial
Altares (Fragmento) | Texto de Gabriela Ortiz
Guadalajara fuera de los estadios
Triplex de la Once: combinación ganadora del sorteo 1
Conoce el clima de este día en Bogotá
Clima en Cartagena de Indias: conoce el pronóstico y prepárate antes de salir
El jefe de inteligencia de Pionyang se reúne con Shoigú ante fortalecimiento de lazos
Nueve detenidos y 10.000 dosis de bótox incautadas tras siete operativos contra clínicas estéticas clandestinas
Los talibanes afirman que el acuerdo militar con Rusia no va dirigido "contra ningún país"
Los ataques de EEUU contra las presuntas "narcolanchas" han dejado ya más de 200 muertos
Detenido por arrojar un objeto ardiendo para incendiar una caseta de la Feria de Córdoba
Sorprenden a joven pareja en Gómez Palacio a bordo de un auto con reporte de robo
Detienen a dos en Gómez Palacio por robo a un pozo de SIDEAPA
El liderazgo también genera valor: el factor humano que protege ingresos y talento en las empresas
Asegura Semovi que reordenamiento del Centro Histórico de Oaxaca será paulatino y gradual