AGI-Eval-Official/CATArena

by AGI-Eval-Official · Agent Eval · updated 5mo ago

CATArena is an engineering-level tournament evaluation platform for Large Language Model-driven code agents (LLM-driven code agents), based on an iterative competitive peer learning framework.

momentum