网页编程众测排名:DeepSeek-R1 超越 Claude 4 加冕全球第一6 月 17 日

DeepSeek-R1 在网页编程众测中超越 Claude Opus 4 成为全球第一,尤其在 LiveCodeBench 上表现接近 OpenAI o3-high。实测显示,DeepSeek-R1-0528 能够快速生成可运行的代码,如太阳系动画、AGI 主题网站等,但在俄罗斯方块小游戏上存在明显 bug。此外,DeepSeek-R1 还被评为当前最佳开源文本模型,在 MIT 许可证下位列总榜第六、开源第一。同时,Kimi-Dev 新模型以 60.4% 的成绩在 SWE-bench Verified 上取得开源 SOTA,编程能力突出。

企业微信二维码