En mai 2023, une équipe de chercheurs a publié un papier pour présenter Voyager, un agent qui s'appuie notamment sur un LLM pour jouer en totale autonomie à Minecraft. A l'époque marginale, cette approche qui consiste à exploiter le potentiel de l'IA générative en faisant d'un modèle une brique parmi d'autres d'un système est désormais devenue centrale.
Dans ces conditions, la relecture attentive du papier et du code mis à disposition à l'époque permet de comprendre comment s'y prendre pour ne pas être dépassé par les développements d'une ingénierie très particulière, visiblement promise à un bel avenir depuis que la croissance des scaling laws semble ralentir, et qu'en conséquence l'industrie cherche à cueillir les low-hanging fruits autrement que par le prompt engineering.
C'est le quatrième et dernier article d'une série. Dans le premier article, Voyager a été présenté dans son principe, de même que les technologies sur lesquelles il s'appuie, et la lecture du code a commencé pour étudier la manière dont Voyager collecte des informations sur l'environnement dans lequel il contrôle le bot - le personnage dans Minecraft. Dans le second article, il a été question de la manière dont Voyager utilise un LLM pour générer la prochaine tâche à faire accomplir par le bot. Enfin, dans le troisième article, c'est la manière dont Voyager utilise un LLM pour générer le code JavasScript qui permet d'essayer de faire accomplir la tâche en question par le bot, puis d'évaluer l'accomplissement de la tâche, et enfin de capitaliser les compétences acquises à cette occasion qui a été étudiée. Désormais que la mécanique d'un agent apparaît clairement, il est possible de prendre de la hauteur pour contempler l'industrie de la production d'agents, laquelle est en pleine expansion.
NB : Ce billet a été rédigé début décembre par un humain et non une boîte de conserve, et sera publié dans un prochain numéro de Programmez!.
Continuer la lecture de "Voyager, l’agent IA qui joue à Minecraft (4/4)"