Meta 推出智能体评估平台 ARE9 月 25 日

Meta 推出新评估平台 Agents Research Environment(ARE)和全新基准模型 Gaia2,用于评估智能体在实际应用中的表现。ARE 旨在创建类似现实世界的环境,任务异步进行、时间不断推移,智能体需在动态约束下调整和执行任务。Gaia2 作为 ARE 重要组成部分,侧重测评智能体在复杂环境中的能力。

企业微信二维码