12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Se trata del primer acercamiento público después de años de tensión, idas y vueltas e intentos de conciliación. La relación entre ambos se truncó después de que la ahora senadora se alineara con LLA
Infobae
En opinión de Verónica Malo, cuando gobernar se convierte en un mecanismo para repartir botín, el Estado deja de ser institución y se vuelve mercado, donde ganan los más cercanos.
SDP Noticias
Infobae
El problema del progreso sin control En el mundo del fitness moderno, uno de los mayores errores no es la falta de esfuerzo, sino la falta de control sobre el proceso. Muchas personas entrenan intensamente, siguen dietas estrictas y buscan resultados rápidos sin entender cómo responde realmente el cuerpo.
Lado.mx
La compañía presenta una nueva solución diseñada para mejorar la ergonomía en entornos de trabajo flexibles, integrando funcionalidad, diseño compacto y conectividad en un solo dispositivo. Colebrook Bosson Saunders ha anunciado el lanzamiento de LANA, un soporte ergonómico para laptops concebido para responder a las nuevas dinámicas del tr
Lado.mx
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El negocio de las Tarjetas Gráficas está lleno de anécdotas de devoluciones por error de envío o por errores de diseño en algunos de sus modelos. Pero en tiempos recientes se han comenzado a ver casos de GPUs que llegaban a los usuarios vía grandes cadenas comerciales o portales
3d Juegos
Empresarios destacaron avances en el diálogo con autoridades, pero llaman a las empresas a reforzar sus estrategias para no caer en omisiones.
Uniradio Informa
Jesús Utrilla / NV Noticias Empresarios de la Ciudad Industrial Bruno Pagliai demandaron agilizar la municipalización de la zona, al advertir que persiste incertidumbre jurídica y retrasos en la atención de infraestructura, lo que impacta directamente en la operación de las empresas y en más de 20 mil trabajadores. Gerardo Correa Falford, mie
NV Noticias
¿Salida de Morena? Andrés Manuel López Beltrán se muestra sonriente durante gira de trabajo como secretario de Organización
SDP Noticias
Tepic, Nayarit.— Durante una visita de trabajo a Nayarit, Andrés Manuel López Beltrán reconoció los resultados obtenidos por María Elizabeth López Blanco en las labores de afiliación y credencialización del partido en el estado. En el encuentro también participó Irvin Glieb Ávila, donde se informó que, junto con los Coordinadores Oper
NTV
Durante una conferencia de prensa en Villahermosa, Selván describió a López Beltrán —también secretario de Organización del Comité Ejecutivo Nacional de Morena— como “un gran activo” del movimiento.
El Imparcial
El tenista italiano firmó un 2-0 (6-2 y 6-3) ante el danés
Infobae
El tenista español se lesionó durante el torneo Conde de Godó y ha tenido que renunciar al Mutua Madrid Open, Roma y Roland Garros
Infobae
Todo el drama, sorpresas y favoritos de la primera semana del Madrid Open 2026. Conoce qué pasó con Carlos Alcaraz, Sinner y dónde ver los cruces
GQ México
Allá por el 2013, Quentin Tarantino nos sorprendió a todos con Django Desencadenado, un western violentísimo que enamoró a una enorme cantidad de espectadores que aún siguen recordando al personaje de Jamie Foxx. Pues bien, 13 años después, tenemos muy buenas noticias para los f
Vida Extra
Michael Jackson estrena película y supera récord de Bohemian RhapsodyLa nueva película de Michael Jackson atrae a 47 mil espectadores en un solo día, rompiendo récords históricos en taquilla.Este artículo es un contenido original de Monterrey Rock
Monterrey Rock
Star Fox es una de esas sagas de Nintendo que sigue en el limbo creativo. Aunque el reciente estreno de la película de Super Mario Galaxy haya vuelto a sacar a la IP y a su protagonista a la palestra, no son muchos los aficionados que esperen un juego del zorro galáctico, aunque el i
3d Juegos
Últimas noticias
Emiratos Árabes Unidos anuncia su retirada de la OPEP en medio de crisis en el estrecho de Ormuz
Sonora primer lugar nacional en rickettsia y dengue
AL PIE DE LA LETRA | La ‘barredora’ de Morena
EL GOBIERNO MUNICIPAL LLEVA ALEGRÍA A LAS COLONIAS DE POZA RICA CON EL FESTIVAL DE LA NIÑEZ
La economía de Irán ha sido maltratada: sus líderes piensan que puede aguantar más que Estados Unidos
Sargazo mantiene presencia variable en Quintana Roo; monitorean posible recale mayor en 48 horas
Autoridades intensifican acciones para prevenir trabajo infantil en zona turística de Playa del Carmen
Hallan a hombre sin vida y con impactos de arma de fuego en Ario de Rosales
Los niños vuelven a ser las mayores víctimas de la nueva guerra Darfur: Unicef
¿Hay contingencia hoy? Esta es la calidad del aire en el AMG este 28 de abril
Martes y Miércoles del Campo en Soriana: Estas son las ofertas de hoy y mañana
Arde refinería en Tuapse: ataque con drones de Ucrania provoca incendio masivo
Cerro de La Campana
La impunidad de siempre invita la intervención
Tren al AIFA