Maxwell Para Simples Indexação

Título

[en] AN LLM-BASED WORKFLOW FOR AD HOC TEAMWORK WITH HUMAN-ROBOT TEAMS IN REAL WORLD SCENARIOS

Título

[pt] UMA ARQUITETURA BASEADA EM LLMS PARA COLABORAÇÕES AD HOC EM TIMES COM HUMANOS E ROBÔS EM AMBIENTES DO MUNDO REAL

Autor

[pt] POLYANA BEZERRA DA COSTA

Vocabulário

[pt] INTERACAO HUMANO-COMPUTADOR

Vocabulário

[pt] AGENTE AUTONOMO

Vocabulário

[pt] COLABORACAO AD HOC

Vocabulário

[pt] MODELO DE LINGUAGEM DE GRANDE ESCALA

Vocabulário

[pt] PLANEJAMENTO AUTOMATICO

Vocabulário

[en] HUMAN-COMPUTER INTERACTION

Vocabulário

[en] AUTONOMOUS AGENT

Vocabulário

[en] AD HOC TEAMWORK

Vocabulário

[en] LARGE LANGUAGE MODEL

Vocabulário

[en] AUTOMATIC PLANNING

Resumo

[pt] À medida que plataformas robóticas se tornam mais acessíveis, seu uso em diversos cenários do mundo real tem se popularizado. Para que essas plaformas possam dar o devido suporte às atividades humanas, é desejável que a colaboração e interação com elas seja flexível e sem muitas regras. A área de pesquisa Ad Hoc Teamwork (AHT) aborda esse desafio ao explorar o desenvolvimento de agentes autônomos que colaborem dinamicamente sem coordenação prévia, regras predefinidas ou protocolos rígidos. Isso requer que o agente infira tarefas, planeje suas ações e se adapte a ambientes dinâmicos em tempo real, geralmente com conhecimento incompleto da tarefa atual ou das pessoas que estão no ambiente. Enquanto a maioria das pesquisas em AHT foca na colaboração agente-agente em ambientes virtuais ou em interações humano-robô em ambientes controlados, o AHT do mundo real apresenta vários desafios adicionais, como comportamentos imprevisíveis por partes dos humanos, tarefas sem definições claras e restrições físicas ao interagir no mundo real. Para atuar efetivamente em tais ambientes, agentes ad hoc devem ter mecanismos de planejamento robustos e ser altamente adaptáveis, inferindo tarefas, reconhecendo oportunidades de colaboração e tomando decisões em tempo real sem impor restrições aos humanos que estejam no ambiente. Neste contexto, esta tese explora a integração de Large Language Models (LLMs) em agentes ad hoc para aprimorar suas capacidades de planejamento e colaboração em cenários do mundo real com humanos. Por terem sido treinados num conjunto vasto de dados, as LLMs apresentam grande capacidade para generalização e conhecimento de senso-comum. Dessa forma, as LLMs podem fornecer insights valiosos que auxiliem o processo de planejamento de tarefas para as quais o agente não foi explicitamente treinado. Ao contrário de abordagens anteriores que dependem de bibliotecas de tarefas predefinidas ou pré suposições sobre o ambiente em que o agente está inserido, propomos um workflow baseado em LLMs que usa Prompt Engineering para melhorar a qualidade dos planos gerados. Nosso método combina a decomposição de tarefas em subetapas usando o método Zero-Shot Chain of Thought, as capacidades de aprendizagem contextual das LLMs, utilizando um método adaptado para buscar exemplos relevantes a serem incluídos no prompt, e autorefinamento por meio de LLMs para melhorar a qualidade do plano final. Com esse workflow, alcançamos 90.20 por cento de similaridade com planos de referência para tarefas únicas sem aplicar refinamentos nos planos, e 82.20 por cento para multitarefas, aplicando refinamentos nos planos, o que mostra um aumento de dois pontos percentuais em relação ao melhor resultado anterior para tarefas únicas e um aumento de 4 pontos percentuais para multitarefas. Esses resultados destacam o potencial das LLMs para gerar planos de ação viáveis para tarefas que o agente não foi especificamente treinado para fazer. Ao abordar o AHT em ambientes reais com humanos, este trabalho contribui para o desenvolvimento de agentes ad hoc capazes de colaboração flexível com humanos em ambientes não estruturados. Nossos resultados ressaltam o potencial de usar LLMs em vários estágios do pipeline AHT, tornando nosso workflow desejável para implantação com supervisão humana.

Resumo

[en] As robotic platforms become more accessible, they are gradually being integrated into diverse real-world scenarios, requiring adaptive collaboration to support human activities effectively. Ad Hoc Teamwork (AHT) research addresses this challenge by enabling autonomous agents to collaborate dy namically without prior coordination, predefined rules, or rigid protocols. This requires the agent to infer tasks, plan actions, and adapt to dynamic environments in real-time, often with incomplete knowledge of the task or their team mates. While most existing AHT research has focused on agent collaboration in virtual environments or constrained human-robot interactions, real-world AHT presents additional challenges, such as unpredictable human behavior, implicit task definitions, and physical constraints. To operate effectively in such environments, ad hoc agents must have robust planning mechanisms and be highly adaptable, inferring tasks, recognizing collaboration opportunities, and making real-time decisions without imposing constraints on human teammates. In this context, this thesis explores the integration of Large Language Models (LLMs) into ad hoc agents to enhance their planning capabilities in real-world scenarios with humans. Given the vast knowledge embedded in LLMs and their strong generalization abilities, they may provide valuable insights that enhance the planning process for tasks the agent was not explicitly trained for. Unlike prior approaches that rely on predefined task libraries or environmental assumptions, we propose an LLM-based workflow that enables on-the-fly planning of tasks, allowing the agent to infer tasks, identify collaboration opportunities, and adapt to dynamic scenarios using contextual information such as verbal instructions and environmental cues. Our method combines task decomposition into sub-steps using Zero-Shot Chain-of-Thought prompting, the in-context learning capabilities of LLMs through an adapted method for retrieving meaningful examples, and self-refinement via LLMs to improve the quality of the final plan. Using this workflow, we achieved 90.20 percent similarity with reference plans for single tasks without plan refinements, and 82.20 percent for multi-tasks with refinements, an improvement of 2 percentage points over the previous best result for single tasks and 4 percentage points for multi-tasks. These results highlight the potential of using LLMs to generate feasible action plans for previously unseen tasks. By bridging the gap between virtual and real-world AHT research, this work contributes to the development of ad hoc agents capable of flexible collaboration with humans in unstructured environments. Our findings underscore the potential of using LLMs across multiple stages of the AHT pipeline, making our workflow suitable for deployment with human supervision.

Orientador(es)

SERGIO COLCHER

Banca

ALBERTO BARBOSA RAPOSO

Banca

SERGIO COLCHER

Banca

EDWARD HERMANN HAEUSLER

Banca

JULIO CESAR DUARTE

Banca

ANTONIO JOSE GRANDSON BUSSON

Catalogação

2026-03-10

Apresentação

2025-04-25

Tipo

[pt] TEXTO

Formato

application/pdf

Idioma(s)

INGLÊS

Referência [pt]

https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75615@1

Referência [en]

https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75615@2

Referência DOI

https://doi.org/10.17771/PUCRio.acad.75615

Arquivos do conteúdo

NA ÍNTEGRA PDF