12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
El pasado 22 de febrero, fue abatido El Mencho durante un operativo para detenerlo.
El Financiero
Los exintegrantes del grupo aclararon que la marca no puede usarse sin el consentimiento de los propietarios
Infobae
La idea es muy atractiva: delegar lo repetitivo, agilizar procesos, producir más y liberar tiempo para pensar en temas de mayor relevancia. Suena casi irresponsable no usarlo. He probado casi todos: ChatGPT, Claude, Gemini, incluso la IA de WhatsApp de Meta para tareas simples de comunicación. Siempre con la misma expectativa: un trabajo limpio,
Merca2.0
Si estás buscando consejos para reservar vuelos económicos, la buena noticia es que no necesitas fórmulas secretas: basta con combinar anticipación, flexibilidad y un proceso de búsqueda ordenado.
Lado.mx
Shutterstock El seguimiento de tu ahorro para el retiro es fundamental para planificar tu futuro financiero. Es esencial estar al tanto de tu estado de cuenta Afore para conocer cómo crece tu patrimonio a lo largo de tu vida laboral.
Lado.mx
En el mundo del deporte y el culturismo, los suplementos y esteroides han ganado popularidad debido a sus efectos potenciadores del rendimiento. Uno de los compuestos más discutidos es la Oxandrolona, conocida por su capacidad para ayudar a mejorar la fuerza y la masa muscular magra.
Lado.mx
Nadine Cortés explica cómo la política migratoria de Trump afecta a miles de personas no solo en EU, sino en México, especialmente a quienes se beneficiaban de las remesas.
El Financiero
El pasado 22 de febrero, fue abatido El Mencho durante un operativo para detenerlo.
El Financiero
La idea es muy atractiva: delegar lo repetitivo, agilizar procesos, producir más y liberar tiempo para pensar en temas de mayor relevancia. Suena casi irresponsable no usarlo. He probado casi todos: ChatGPT, Claude, Gemini, incluso la IA de WhatsApp de Meta para tareas simples de comunicación. Siempre con la misma expectativa: un trabajo limpio,
Merca2.0
Andrés “N” y Genaro “N” fueron puestos a disposición de un juez federal tras su captura en el operativo donde murió Nemesio Oseguera Cervantes, líder del Cártel Jalisco Nueva Generación.The post Trasladan a presuntos operadores del CJNG a penal de máxima seguridad appeared first on Sol Yucatán.
Sol Yucatán
La Fiscalía de Puebla confirmó que el ataque afuera del bar "Sala de Despecho" fue producto de una confusión: los agresores dispararon contra el vehículo equivocado.
El Financiero
Atención fans de ‘Bridgerton’, en el 2026 llega la cuarta temporada que estará dividida en dos partes. La primera esta disponible en Netflix desde el 29...The post ‘Bridgerton’ temporada 4: Fecha de estreno y tráiler oficial appeared first on Sopitas.com.
Sopitas.com
Texto – Redacción. Fotografías – Netflix. Ayer por la noche, Madrid se vistió de Los Bridgerton para celebrar el estreno de la segunda parte de la cuarta temporada de la serie. Los protagonistas Luke Thompson (Benedict Bridgerton), Yerin Ha (Sophie Baek) y Hannah Dodd (Francesca Bridgerton) acudieron a Madrid para celebrar un
Barnafotopress.com
Todo lo que debes saber sobre la parte 2 de Bridgerton temporada 4 y a qué hora la podrás ver en Netflix
Merca2.0
La superestrella de la NFL Odell Beckham Jr. se ha convertido en tendencia en redes sociales, pues una modelo lo ventaneó, al contar un extraño y asqueroso fetiche que tiene con las mujeres. Todo ocurrió en el podcast de Celina Powell, donde se publicó un video en el que el receptor de los Cleveland Browns … La entrada Ventila modelo asqueros
Criterio Hidalgo
El gusto por las heces durante el sexo es una parafilia llamada coprofilia
La Opinión de Los Ángeles
ESTADOS UNIDOS.- Pa’ los gustos los colores. Recientemente ha salido a la luz un raro fetiche de Odell Beckham Jr., mismo del cual se ha hablado mucho en redes sociales, a tal grado de convertirse tendencia en Twitter. La modelo, Celina Powell, estuvo en la más reciente emisión del ‘No Jumper Podcast’ y habló de …
SuperL1der
Nikola Jokic had 26 points, 15 rebounds and 11 assists to counter his nine turnovers, Jamal Murray finished with 23 points, and the host Denver Nugget
Deadspin
Terminó todo el revuelo de la fecha límite de canjes en la NBAy la atención ahora se concentra en el NBA All-Star Weekend. El gran evento de media temporada se celebra este fin de semana en el Intuit Dome de Inglewood, en el área metropolitana de Los Ángeles. Es un evento que, que en los últimos años, ha lidiado con la falta de atención de
Milenio
Sin jugar un solo minuto esta temporada por lesión, Damian Lillard logró este sábado su tercera victoria en el concurso de triples del Juego de las Estrellas de la NBA, igualando el récord de Larry Bird y Craig Hodges.Lillard, de 35 años, poseía dos títulos consecutivos de 2023 y 2024 y sorprendió a la liga al anotarse al concurso de esta e
Milenio
Últimas noticias
Mirador
ANTONIO GONZÁLEZ-KARG DE JUAMBELZ
Revancha de Vinícius y el Real Madrid avanza
Póker TRIcolor
Papá de Héctor Zamorano habla del deceso su hijo
"Flojo" mercado de mariscales en NFL
Laguneros van a la Espartaqueada
LAS PALABRAS TIENEN LA PALABRA
Barcelona elimina en penales a Argentinos Jrs.
Levantan Paro de Labores en 17 planteles
Toros remonta y gana en Hermosillo
Luis "Pepón" Juárez anuncia su retiro
Identifican 2 mineros más en Pasta de Conchos
Reforma unilateral
"Batacazo" en Acapulco, Zverev queda eliminado