12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Desde 2014, Burger & Fries (B&F para los habituales) conquista a los parisinos con sus hamburguesas caseras, su buena relación calidad-precio y sus tres locales bien situados en la capital. Con recetas elaboradas con productos frescos, hamburguesas desde 6,90 € y menús a partir de 9,90 €, la cadena se impone como una parada gastronómica a te
Sortiraparis
El funcionamiento presentará cambios en la atención de hospitales, cementerios, transporte, estacionamiento y oficinas públicas
Infobae
El Servicio de Administración Tributaria (SAT), la principal autoridad tributaria de México, obtuvo facultades para supervisar en tiempo real las operaciones de casinos, tragamonedas, sorteos y apuestas deportivas.
Lado.mx
El interés por las criptomonedas no ha dejado de crecer en los últimos años. Cada vez más personas buscan formas de participar en este mercado, ya sea como una alternativa de inversión o como una forma de diversificar sus ingresos.
Lado.mx
Las cadenas comerciales enfrentan un desafío constante: garantizar que cada sucursal pueda procesar pagos sin interrupciones, sin importar las condiciones. Una caída de internet, una terminal dañada o un pico de demanda inesperado pueden paralizar las ventas en minutos.
Lado.mx
El exguardameta fue intervenido tras presentar complicaciones abdominales, con evolución favorable hasta el momento
El Informador
El estreno de Crimson Desert fue un tanto polémico, pero hay algo en lo que todo el mundo estuvo de acuerdo desde el principio. Pearl Abyss ha publicado uno de los mundos abiertos más extensos y divertidos de explorar de los últimos años. Tanto es así que la situación se ha conve
3d Juegos
Infobae
Nickeil Alexander-Walker scored 32 points and Jalen Johnson flirted with a triple-double as the Atlanta Hawks crushed the host Orlando Magic 130-101 o
Deadspin
Los uniformados realizaban patrullajes preventivos en la población de Palo Alto, cuando un grupo de sujetos armados comenzó a dispararles Apatzingán, Mich.- La tarde de este miércoles, una célula criminal atacó a balazos a personal de Fuerzas Federales […]La entrada Autoridades abat
Respuesta.com.mx
As second-place teams having worked their way through an erratic March, the Pittsburgh Penguins and Tampa Bay Lightning will try to sharpen their resp
Deadspin
Rayadas vs Pumas se verán las caras en un duelo crucial por la Fecha 15 de la Liga MX Femenil, donde ambos conjuntos buscan consolidar su posición en la tabla general rumbo a la Liguilla. Sigue el resultado en vivo de este enfrentamiento que promete grandes emociones, ya que una victoria para cualquiera de las …
365scores
Los usuarios acostumbran a salir durante los feriados y por eso, requieren conocer con anticipación los horarios y rutas del Metropolitano para organizar sus desplazamientos y evitar contratiempos en sus trayectos
Infobae
La Línea 1 del Metro de Lima mantendrá un horario especial durante Jueves y Viernes Santo, permitiendo la movilidad segura de miles de pasajeros en la capital
Infobae
No tienes que salir de la capital para tener días llenos de diversión; en la Ciudad de México también es posible con tanta oferta cultural y de entretenimiento que existe a lo largo y ancho de las alcaldías. Hoy queremos platicarte del Acuario Michin de CDMX, el lugar ideal para toda la familia; te compartimos […]The post Acuario Michin
Gluc.mx
La Luna aparecerá al atardecer y se elevará justo por encima del horizonte, momento en que parecerá de mayor tamaño. ¡No te la pierdas!La entrada Hoy hay Luna Rosa, la primera luna llena del año y la que determina la fecha de Pascua se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
La noche de este miércoles 1 de abril, una imponente luna llena iluminó el cielo de Tijuana, destacando por su brillo y tamaño aparente, en un fenómeno conocido como “Luna Rosa”, vinculado con el calendario de Semana Santa.
El Imparcial
La Luna llena de abril, conocida como “Luna Rosa”, iluminó el cielo de México y diversas partes del mundo durante la noche de este mes, generando interés entre observadores y aficionados a la astronomía. Aunque su nombre sugiere un cambio de color, en realidad el satélite no adquiere tonalidades rosadas, sino que mantiene su apariencia [
Seunonoticias.mx
Últimas noticias
Sheinbaum sustituyó a su canciller Juan Ramón de la Fuente y el PAN lo celebra: “Se tuvo al peor Canciller que se tiene memoria”
TRÁILER CARGADO CON LECHE SE INCENDIA EN EL LIBRAMIENTO DE CARDEL; NO HAY LESIONADOS
Aprueba Cabildo de Veracruz requisa de alumbrado público a Wardenclyffe
Dan respuesta a demanda de agua en Poza Rica
La Ruta del DIF llega a la comunidad Donato Marquez
Entregan viviendas a pescadores
Ester Expósito y Mbappé, romántico reencuentro en la capital tras unos días separados
La Constitución lusa cumple 50 años con debate sobre su revisión y polémica con la ultraderecha
Previa del Kosner Baskonia - Real Madrid
Juanma Moreno cree "intolerables" cánticos racistas e insta a evitar "este tipo de cosas"
Lupita Jones niega que Fátima Bosch deba perder la corona de Miss Universo, pero lanza ésta fuerte advertencia
El Ejército de EEUU señala un "progreso innegable" en la guerra en Irán
Wall Street cae un 1,28 % tras la promesa de Trump de seguir atacando a Irán "con dureza"
La violencia sexual infantil escala en Chihuahua tras casi mil casos en solo un año
MARVEL Tkon: Fighting Souls | Guía de preórdenes y ediciones especiales