back
icon share
  1. 热门话题
  2. 每日早报
  3. 排行榜
  4. AIarrow
  5. 专业版
OpenAI 开源 BrowseComp,重塑 Agent 浏览器评测4 月 11 日

OpenAI 开源智能体浏览器功能测试基准 BrowseComp,难度极高,GPT-4o 和 GPT-4.5 准确率接近于零,带浏览器功能的 GPT-4o 也仅 1.9%,而新发布的 Deep Research 准确率达 51.5%,在搜索、整合与校准方面表现出色。

链接OpenAI 开源浏览智能体评测基准 BrowseComp
界面
链接OpenAI 开源 BrowseComp,重塑 Agent 浏览器评测
36Kr
链接刚刚,OpenAI 开源 BrowseComp,重塑 Agent 浏览器评测
站长之家
展开展开全部报道
话题追踪话题追踪
2025-10-09
OpenAI 发布全新 GPT-5 Pro API
2025-10-08
OpenAI 发布战略级 AgentKit 工具套件,推动企业级智能体应用开发
2025-10-07
OpenAI 推出小型语音模型 GPT-5 Pro
2025-09-11
OpenAI 推出 ChatGPT 开发者模式,首次支持 AI 直接控制外部工具
2025-08-08
微软:将把 OpenAI 的 GPT-5 模型整合到消费者、开发者和企业产品中
2025-08-08
OpenAI 发布 GPT-5
2025-08-07
AMD、高通宣布旗下硬件支持 OpenAI gpt-oss 开放推理模型
2025-08-06
OpenAI 发布两款开源模型,性能逼近 o4/o3-mini
2025-07-16
OpenAI 开发 AI 浏览器「Aura」,或将重塑网络浏览体验
2025-07-10
OpenAI 被曝入局浏览器
查看更多
企业微信二维码
添加 Readhub 到桌面
1. 点击浏览器分享图标
click share icon
2. 选择添加到主屏幕
add to screen
知道了