AGENTGEN: Automazione della Generazione di Ambienti e Compiti per gli LLM

AGENTGEN: Automazione della Generazione di Ambienti e Compiti per gli LLM
I Large Language Models (LLM) hanno trasformato significativamente il modo in cui approcciamo i sistemi basati su agenti. Questi sistemi interagiscono con ambienti diversi per eseguire azioni mirate al raggiungimento di obiettivi specifici. Un avanzamento fondamentale in questo campo è l’introduzione di AGENTGEN da parte dei ricercatori dell’Università di Hong Kong e della Microsoft Corporation. Questo nuovo framework sfrutta gli LLM per automatizzare la creazione di ambienti e compiti di pianificazione, segnando un significativo salto nelle metodologie di addestramento degli agenti.

AGENTGEN è progettato per affrontare una delle principali sfide nella ricerca sugli LLM: il lavoro manuale intensivo richiesto per creare manualmente ambienti di pianificazione variati.
I metodi tradizionali si basano fortemente su scenari progettati manualmente, che limitano la diversità e il volume dei dati di addestramento, limitando in ultima analisi il potenziale degli LLM di generalizzare tra diversi scenari. Automatizzando la generazione di ambienti e compiti, AGENTGEN arricchisce i dataset di addestramento, migliorando così le capacità di pianificazione degli agenti basati su LLM.

Un aspetto unico di AGENTGEN è il suo sofisticato metodo di generazione dei compiti attraverso una tecnica di evoluzione bidirezionale nota come BI-EVOL. Questo metodo evolve i compiti semplificando le condizioni degli obiettivi o aumentando la loro complessità, risultando in un insieme completo di compiti di pianificazione che supportano una curva di apprendimento graduale. L’implementazione di BI-EVOL ha portato alla creazione di 592 ambienti unici, ognuno con 20 compiti, producendo 7.246 traiettorie di alta qualità per l’addestramento.

L’efficacia di AGENTGEN è stata rigorosamente testata sulla piattaforma AgentBoard, con risultati che mostrano miglioramenti significativi nelle capacità di pianificazione degli agenti basati su LLM. In particolare, il modello Llama-3 8B ottimizzato con AGENTGEN ha superato le prestazioni di GPT-3.5 e, in alcuni compiti, ha superato GPT-4. Specificamente, AGENTGEN ha ottenuto più di cinque volte il miglioramento nei compiti in-domain per Llama-3 8B, con tassi di successo che sono saliti da 1.67 a 11.67. Inoltre, ha dimostrato un notevole miglioramento nei compiti out-of-domain, raggiungendo un tasso di successo di 29.1 su Alfworld, rispetto a 17.2 per GPT-3.5.

hashtag#IntelligenzaArtificiale hashtag#ApprendimentoAutomatico hashtag#LLM hashtag#RicercaIA hashtag#Innovazione hashtag#Tecnologia hashtag#Microsoft hashtag#UniversitàDiHongKong hashtag#AGENTGEN hashtag#AutomazioneAI

AgentGen: Automating Environment and Task Generation to Enhance Planning Abilities in LLM-Based Agents with 592 Environments and 7,246 Trajectories

marktechpost.com

Contact

Contact Information

Subscribe Newsletter:
Send us a Message