12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El Financiero Bloomberg TV
El grupo promueve la cultura pachuco mientras realiza colectas y apoyo a personas en situación vulnerable.
El Imparcial
¿Les platico? ¡Arre!
Vanguardia.com.mx
La compañía presenta una nueva solución diseñada para mejorar la ergonomía en entornos de trabajo flexibles, integrando funcionalidad, diseño compacto y conectividad en un solo dispositivo. Colebrook Bosson Saunders ha anunciado el lanzamiento de LANA, un soporte ergonómico para laptops concebido para responder a las nuevas dinámicas del tr
Lado.mx
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
El ministro Pedro Sánchez confirmó que la ofensiva militar en El Tarra también permitió inutilizar más de 300 explosivos adaptados para drones y la destrucción de varios búnkeres
Infobae
Infobae
La actriz se refirió en Almorzando con Mirtha a su sorpresiva pelea con la diva. Su palabra
Infobae
Muy cuestionables por las cifras duras del INEGI, Coneval, Banxico y SHCP * El país requiere al timón de mando a una auténtica jefa de Estado con un sólido liderazgo, capaz de iniciar la verdadera transformación por un México próspero, justo y democrático MARKOFLOS Después de siete años y medio de los gobiernos […]El c
Impacto
Criterio Hidalgo Digital
El debut de la colombiana como ‘headliner’ estuvo marcado por colaboraciones en vivo, homenajes a iconos del género y un repertorio adaptado a las estrictas normas del evento, tras un retraso que obligó a reducir la lista de canciones
Infobae
Coachella 2026: Transmisiones en Vivo de Artistas como Justin BieberDisfruta las presentaciones de artistas como Justin Bieber y Karol G durante el Weekend 2 de Coachella 2026.Este artículo es un contenido original de Monterrey Rock
Monterrey Rock
El portal Global Mega Stardom dio a conocer cuáles fueron los actos más vistos durante la primera semana del festival, considerando tanto los usuarios conectados en vivo como las visualizaciones que recibieron las presentaciones a lo largo de la semana posterior a la primera parte del evento
Infobae
Evita cualquier imprevisto en tu día y conoce el pronóstico del tiempo para las próximas horas en la ciudad
Infobae
Ayacucho cuenta con diferentes atractivos turísticos y conocer el clima puede ayudarte a evitar inconvenientes en tu visita
Infobae
Estar al pendiente de las condiciones meteorológicas de las siguientes horas en la ciudad te facilitará tomar decisiones más informadas para poder disfrutas de tu día con tranquilidad y sin sorpresas
Infobae
Stephon Castle scored a career-high 40 points while grabbing 12 rebounds and dishing out 12 assists as the host San Antonio Spurs pulled away for a 13
Deadspin
Stephon Castle logró un récord personal de 40 puntos, 12 rebotes y 12 asistencias, el segundo triple-doble en su carrera para el triunfo de Spurs.
ESPNdeportes.com
San Antonio Spurs guard Stephon Castle was ruled out of Tuesday"s road game against the Los Angeles Lakers following a second-quarter pelvis injury.,C
Deadspin
Últimas noticias
Puebla fortalece su liderazgo tecnológico
Alerta en Asia: Corea del Norte lanza misiles y prueba su capacidad destructiva
Mortandad masiva de miles de peces en el río Pánuco; Conagua dice que es por apertura de una compuerta que provocó la mezcla de agua dulce y salada
Iglesia califica aborto y eutanasia como “flagelos” y llama a defender la vida
Borrón y cuenta nueva: sin pausa México y España / José Luis Enríquez Ambell
EU inicia maniobras militares anuales con Filipinas en pleno conflicto de Medio Oriente
De menor extraviado a líder secuestrador
Sube aprobación de Maru Campos al 55.4%
Búsqueda de Corazones Unidos cierra con siete nuevos cuerpos hallados en Lomas de la Capilla
Los Chapitos encabezan lista de los más buscados de la DEA
Dijo que iba a Corpus Christi, un perro encontró 11 kilos de cocaína bajo el piso de su camioneta y confesó que lo hizo por una deuda: así cayó el exdirector del Ayuntamiento de Matamoros en Texas
Paulina Mart?nez y Diego D?az ganan bronce en el Campeonato Panamericano de Judo Panam? 2026
M?xico avanza en la consolidaci?n del Sistema Universal de Salud
Reconocimiento UAT
Las últimas previsiones para Culiacán Rosales: temperatura, lluvias y viento