Los investigadores de Facebook Research desean crear un asistente digital avanzado que, al contrario de lo habitual en el campo de la inteligencia artificial, no ofrezca un rendimiento sobrehumano circunscrito a una única tarea, sino uno que sea competente gestionando un amplio abanico de las mismas. Y no sólo eso, sino que sea capaz de aprender nuevas tareas a medida que interactúa con los seres humanos.
Y la manera en que piensan lograrlo es integrando este asistente en el popular videojuego Minecraft (el más vendido de todos los tiempos, con más de 170 millones de copias, y más de 90 millones de usuarios mensuales). Este juego, de tipo 'sandbox', permite explorar libremente un amplio mundo virtual y explotar sus recursos naturales, crear herramientas y construir toda clase de estructuras usando bloques.
Según explican en el 'paper' académico publicado en arXiv, los investigadores eligieron Minecraft porque ofrece un número casi ilimitado de posibles tareas, pero lo hace dentro de un mundo con reglas simples y, hasta cierto punto, predecibles.
Tanto, que los investigadores de inteligencia artificial ya están empezando a usar este juego como plataforma para entrenar y probar otros de sistemas de IA distintos, igual que hace 4 años se usaba para entrenar robots.
Las condiciones del entorno permiten que la ejecución de una tarea sea sencilla una vez que ésta se especifica, permitiendo que [los movimientos a realizar] e incluso la exploración y combate pueden ser razonablemente 'programados'.
"Los jugadores de Minecraft son creativos, y la diversidad de objetos construidos por ellos en el juego es asombrosa [...] Incluyen monumentos, esculturas, templos, montañas rusas y paisajes urbanos completos.
El objetivo perseguido por Arthur Szlam y sus compañeros de Facebook Research es que podamos pedirle al asistente, mediante órdenes verbales, que construya las estructuras que necesitemos en cada momento. Ése es otro de los obstáculos a los que tendrá que hacer frente el asistente: las complejidades del lenguaje coloquial, y la deficiente capacidad de los humanos para explicar en qué clase de estructuras concretas está pensando en un momento dado.
Una frase aparentemente sencilla como "Construye una torre de 20 bloques de altura y sitúa un smiley gigante en la cima" requiere en realidad de un grado de conocimientos notable, de una comprensión de la estructura de la frase, de un sonido claro que permite identificar bien las palabras, etc.
Y luego queda lo más difícil: el asistente debe ser capaz de comprender el concepto "torre", saber cómo construirla y entender a qué se refiere su interlocutor con las expresiones "bloques de altura", "smiley" o "cima de la torre"; y no olvidemos identificar a cuál de ellas se vincula cada una de las cifras mencionadas ('20' en este caso). Todo eso es lo que Szlam busca conseguir con este 'entrenamiento' en Minecraft.
Vía | MIT Technology Review
Imagen | interestedbystandr (Wikimedia)
.