12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Grupo Ictze en Veracruz: de Fidel a Nahle, contratos millonarios, adjudicaciones directas y equipos que “no cumplen”, según auditorías federales
La Clave Online
Tiger Woods was granted a request Wednesday by a Florida judge to leave the United States to enter a comprehensive inpatient treatment facility as he
Deadspin
El régimen de la 4T logró en siete años destruir el sistema democrático y pervertir el régimen republicano. Sobre sus ruinas implantó una maquinaria de poder autoritario incontrastable. Este Leviatán es amo y señor. Son pocos los residuos democráticos que sobreviven. Controla los tres poderes de la Unión: Ejecutivo, Legislativo y J
Re-evolucion.mx
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
La Saga by Adela Micha
Grupo Ictze en Veracruz: de Fidel a Nahle, contratos millonarios, adjudicaciones directas y equipos que “no cumplen”, según auditorías federales
La Clave Online
Nom Pen, 2 abr (Prensa Latina) Camboya y Alemania reafirmaron hoy su compromiso de ampliar la cooperación en formación técnica, pasantías y programas de intercambio dirigidos a jóvenes trabajadores tras un encuentro entre representantes de ambas naciones.The post Impulsan Camboya y Alemania cooperación bilateral first appeared on Noticias Pre
Prensa Latina
A 45 días de inicio de derrame en Golfo, autoridades dejaron de lado versión de que un barco fue responsable y ahora apuntan a chapopoteras.
Reforma
Frente al peso cultural de la gran actriz, poco significa un reportaje de The Economist cargado de dogmatismo neoliberal; esa visión tan elemental del mundo
SDP Noticias
#Tuxpan En sesión formal, quedaron instalados el Consejo de Seguridad Pública Municipal y el Comité de Participación Ciudadana, órganos que consolidan la coordinación institucional y abren un espacio permanente para la participación activa de la sociedad en las decisiones en materia de seguridad. Durante el acto, el presidente municipal, Dan
Gráfico Al Día
Madrid, España, 1 de abril de 2026. Un terremoto de magnitud 7,4 en la escala Richter ha sido registrado este jueves en aguas de Indonesia y ha provocado alertas de tsunami para el propio país, Filipinas y Malasia. El Servicio Geológico de Estados Unidos (USGS) ha informado de que el temblor ha sido registrado a …El cargo Terremoto de magn
El Sur de Acapulco
Al menos una persona murió tras el terremoto de magnitud 7.4 registrado este jueves frente a las costas del noreste de Indonesia, después de que quedara sepultada por los escombros de un edificio colapsado en la zona de Manado, según informó el medio indonesio Metro TV.El seísmo, que ocurrió a las 22:48 GMT (05:48 hora local), tuvo su epice
El Siglo de Torreón
Las redes sociales han estallado luego de un sorprendente anunció, la marca de chocolates KitKat fue víctima de un robo millonario. De acuerdo con lo anunciado de manera oficial 12 toneladas de barras desaparecieron en Europa. KitKat Tracker: así puedes saber si tu chocolate fue uno de las 12 toneladas robadas Nestlé ha lanzado una […]The
Gluc.mx
La implicación de robar 12 toneladas de Kitkat en Europa cambia por completo el concepto de un simple robo. Este acto enciende por mucho las alarmas al sector industrial alimentaria y logística. Por medio de un comunicado, la empresa multinacional de origen Suizo, Nestlé reveló que un camión con más de 400 mil unidades de …El cargo ¿D
Tribuna Noticias
La multinacional suiza Nestlé ha confirmado el pasado 29 de marzo el robo de un cargamento de 12 toneladas de chocolates KitKat mientras eran transportados desde una fábrica en Italia hacia Polonia.
Vanguardia.com.mx
Oneil Cruz homered for the second straight day and Paul Skenes bounced back from a rough season opener to lead the Pittsburgh Pirates to an 8-3 win ov
Deadspin
Uno de los dramas médicos de 2025 que se convirtió en un fenómeno en Estados Unidos y el mundo es The Pitt. La historia creada por R. Scott Gemmill donde el personal del Centro Médico de Trauma de Pittsburgh vive un turno agotador entre pacientes, residentes y urgencias del día. Aunque ahora está en emisión […]The post Resumen del epis
Gluc.mx
As second-place teams having worked their way through an erratic March, the Pittsburgh Penguins and Tampa Bay Lightning will try to sharpen their resp
Deadspin
Últimas noticias
La razón por la que Creta y otras zonas de Grecia se tiñeron de rojo
Los excrementos ayudan a la conservación de las nutrias europeas: “Patrullan sus zonas de marcaje” y detectan intrusos en menos de 24 horas, según un estudio
Coliseo Medplus y CAR firman acuerdo de 10 años para revitalizar la orilla del río Bogotá
Diealis: Fiscalía inicia proceso contra influencer por presunto intento de feminicidio tras denuncia de su expareja
Aniversario de la muerte del legendario “Juanito”
Irán acusa a EEUU de realizar demandas "irracionales" y niega conversaciones directas para un alto el fuego
Sarabia: "Me gustaría que el mundo del fútbol fuera más ejemplar para la juventud"
Las últimas previsiones para Houston: temperatura, lluvias y viento
El diseño arquitectónico de La Nueva Romareda, finalista en los World Stadiums Awards 2026
Mbappé pide paso
Irán denuncia un ataque contra la sede del Instituto Pasteur en Teherán en la ofensiva de EEUU e Israel
Clima en Dallas: conoce el pronóstico y prepárate antes de salir
El Mutua Madrid incorpora medidas de accesibilidad para personas con autismo
Cuarenta años después de la catástrofe, Chernóbil mantiene un enconado debate sobre la energía nuclear
Pronóstico del clima en Panamá para este 2 de abril