12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
La contundente goleada a Paraguay fue recibida con mesura durante la fiesta futbolística en el Centro Cívico de Pasadena
La Opinión de Los Ángeles
Absorberá gobierno de Veracruz pago de 149 mdp en penalizaciones por pago anticipado de deuda de bursatilización
La Clave Online
La víctima viajaba en una motocicleta negra de bajo cilindraje y, de manera preliminar, trascendió que no portaba casco de seguridad. El conductor del vehículo pesado fue retenido mientras las autoridades realizan las investigaciones para determinar cómo ocurrieron los hechos. Un adolescente de 17 años perdió la vida la tarde de este miércol
Tráfico ZMG
Antes de que llegue la retroexcavadora, antes de que se instale el primer andamio y antes de que comience cualquier actividad de obra, hay un elemento que ya debe estar en el sitio: la caseta.
Lado.mx
Si estás intentando consultar el estatus de tu solicitud o recuperar tu número de folio y te topaste con que la página buscador.becasbenitojuarez.gob.mx/folio está completamente desconectada, no estás solo.
Lado.mx
El mercado mexicano de apuestas en línea está experimentando una transformación acelerada. Lo que hace apenas unos años seguía siendo un nicho con un número limitado de operadores locales se está convirtiendo en un escenario competitivo a gran escala con la participación de marcas globales.
Lado.mx
Estados Unidos debutó ante Paraguay tras la tercera ceremonia de apertura del torneo Notipress.- El Estadio Los Ángeles, conocido como SoFi Stadium, cerró el ciclo inaugural del Mundial 2026 con una ceremonia de siete minutos antes del partido entre Estados Unidos y Paraguay. La celebración reunió diversos géneros musicales como pop,
MPV
Biomarcadores epigenéticos orientan prevención personalizada contra deterioro cognitivo Notipress.- La prevención del deterioro cognitivo incorpora herramientas de neurociencia, medicina de precisión y biomarcadores epigenéticos para evaluar cómo los hábitos influyen en la salud cerebral. Este enfoque permite observar factores asociados con
MPV
El mayor consumo se concentró en restaurantes, hoteles, bares, transporte, comercios, souvenirs y activaciones locales
Infobae
Milenio
El valor de los carburantes en el país puede cambiar debido a múltiples factores como el tipo de cambio frente al dólar, impuestos y la logística para el traslado
Infobae
La presidenta de México declinó tanto el protocolo reservado por la FIFA para los jefes de Estado como la asistencia al Fan Fest del Zócalo y optó por seguir la inauguración del Mundial 2026 desde el Deportivo Hermanos Galeana, en la Ciudad de México, con morenistas y ciudadanos
Debate.com.mx
ATENCIÓN: El artículo contiene SPOILERS de El día de la revelación (Disclosure Day). La nueva película de Steven Spielberg, El día de la revelación (Disclosure Day), supone por fin el regreso triunfal del Rey Midas de Hollywood a uno de sus géneros favoritos, la ciencia ficción. Después de éxitos como E.T. el extraterrestre, Encuentros
Hipertextual
El astrofísico dejó claro que no compra las teorías sobre pruebas ocultas y pidió una demostración real de esos supuestos hallazgos
Infobae
La tercera jornada de la Copa del Mundo tendrá cuatro encuentros, donde se destaca el debut de Brasil frente a Marruecos. La agenda futbolera del Mundial 2026 de este sábado 13 de junio trae una cartelera llena de emociones con cuatro partidos que prometen un nivel de primera. Primero, Qatar se mide ante Suiza buscando la campanada en el Grupo B;
BolaVip Mexico
Choque de estilos y urgencia de puntos en el Grupo D
El Informador
Los Socceroos ultiman detalles para lo que será una dura prueba en el inicio de su aventura internacional. Este domingo 14 de junio de 2026, la selección de Australia se medirá ante Turquía sobre el césped del BC Place Stadium de Vancouver. El representativo de la confederación asiática asume este compromiso con la clara premisa …
365scores
La máxima cita del fútbol internacional nos depara uno de los enfrentamientos tácticos más atractivos de la primera fase. Este sábado 13 de junio, la selección de Marruecos se medirá ante su similar de Brasil en un compromiso válido por la fase de grupos de la Copa del Mundo de 2026. Los Leones del Atlas …
365scores
La actividad de la Copa Mundial 2026 continuará este sábado con una agenda cargada de futbol, cuatro partidos de fase de grupos y el esperado debut de Brasil, una de las selecciones que más expectativa genera en cada edición del torneo.
Vanguardia.com.mx
Aquí tienes la previa de los cuatro partidos del Mundial 2026 programados para este sábado 13 de junio; destaca el Brasil vs MarruecosLa entrada ¿Dónde ver los partidos del sábado 13 de junio? Brasil y Marruecos salen a escena en el Mundial aparece primero en López-Dóriga Digital.
Lopezdoriga.com
Últimas noticias
El IDEFT firma convenio con Hidromatic Himea para fortalecer la capacitación laboral en Jalisco
La Aemet activa avisos por calor y tormentas en diez comunidades autónomas: temperaturas cercanas a los 40 grados
ASTROLABIO POLÍTICO/ La fiesta que derrotó al desastre
Bancos y SAT confirman si abrirán este 11 de junio durante la inauguración del Mundial 2026 en México
México vs Sudáfrica EN VIVO el minuto a minuto del Partido Inaugural de la Copa del Mundo 2026
Maestros de la CNTE bloquean garita Dennis DeConcini en Nogales por demandas salariales y del ISSSTE
SEP acusa a la CNTE de usar protestas para afectar el Mundial 2026 y compromete diálogo educativo
Así fue la ceremonia inaugural del Mundial 2026: Shakira, Maná y Belinda brillan en el show de apertura
Caída de ViX genera quejas horas antes de la inauguración del Mundial 2026; usuarios reportan fallas en transmisiones
¿Pausa o antesala de una nueva escalada? Estados Unidos e Irán intercambian amenazas, USA ataca mientras Trump habla de detener los bombardeos
“Ser diferente nunca es el problema”: la médica judío-mexicana que habla sin filtros sobre ser judía y LGBTQ
10 de junio: Nace uno de los escritores más importantes del siglo XX estuvo a punto de abandonar la literatura?
11 de junio de 1912: Muere Arthur L. Welsh, el primer aviador judío en un accidente aéreo
11 de junio del 2019, muere Velvel Pasternak conservador de música jasídica
Entre tradición y vanguardia: Luca’s