首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

DeepSeek V3-0324深度实测:小小升级,巨大进步

  • 25-04-22 03:00
  • 3514
  • 5442
juejin.cn

前言

昨日(3月24日)深夜,DeepSeek 以"小版本升级"的名义悄然推出V3-0324模型。

尽管官方未高调宣传,但6850亿参数的规模、接近Claude 3.7的编程能力以及更宽松的MIT开源协议,让这次更新成为AI开源社区的现象级事件。

白天有点事情,没有第一时间测试,这就补上。

更新内容

  • 编程能力:前端代码生成质量达Claude 3.7同级,可完整实现复杂功能模块开发。
  • 数学推理:突破高等数学全领域解题,实现从计算到逻辑推理的跨越式升级。
  • 对话交互:上下文窗口从64K扩展至128K,支持更复杂的多轮对话。
  • 响应速度:新增快速响应模式,简单任务处理效率提升40%+且API无缝兼容。
  • 免费商用:采用MIT协议,允许商业场景免费使用,降低企业集成门槛。
  • 风格调整:输出风格转向技术化、专业化,弱化拟人化表达。

提升评测

相比较DeepSeek V3,DeepSeek V3-0324在多个评测指标中都有显著提升:

  • MMLU-Pro:从75.9提升至81.2(+5.3)
  • GPQA:从59.1跃升至68.4(+9.3)
  • AIME:实现最大幅度提升,从39.6飙升至59.4(+19.8)
  • LiveCodeBench:从39.2进步到49.2(+10.0)

DataLearnerAI 的大模型官方评测排行榜可以看出,明显超过 Claude 3.5。

数据来源:www.datalearner.com/ai-models/a…

实测

挑选了两个之前分享过的场景做个对比。

SVG生成

昨天刚分享了 Claude 3.7 生成SVG的效果,今天咱就对比下 DeepSeek V3-0324 效果如何。

《从理科到文科的华丽转身:Claude 3.7轻松生成SVG图形,让你创作升级 - 掘金》

Claude 3.7

V3-0324

V3

虽然有些细节没有到位,但整体效果其实已经非常可以了。

毕竟为了对比,我是一字未改的采用了 Claude 3.7 的提示词(针对Claude优化过的),如果针对 DeepSeek V3 稍微优化下,估计能够更加完善。

前端界面生成

DeepSeek V3-0324这次专门提到了前端效果生成提升,那我们也测试下。

《Cursor实战:非前端人员实现工作台前端需求 - 掘金》

Claude 3.7

V3-0324

确实很好,可以说和 Claude 3.7 不相上下。

V3 之前版本的效果就不放了,差距有点大。

V3-0324 免费 API

之前 DeepSeek 一直使用的硅基流动 API,但是今天尚未上线 V3-0324,为了给大家看效果,就去 DeepSeek 官网充值了。

结果,刚充值完,我就看到了一篇分享,OpenRouter 上V3-0324 免费,我...

分享给大家,大家可以免费体验去。

openrouter.ai/deepseek/de…

总结

通过实测,我们看到了 DeepSeek V3-0324 在生成SVG以及前端界面方面的表现确实很不错,平均下来也是Claude 3.6+ 的水平了。

甚至,考虑到我 V3 使用经验不够,它可能还有提升空间。

让我们期待下吧,希望 DeepSeek 未来持续进步,完全替代国外的模型,也让我们可以毫无留恋地转到完整的国内生态中。

加油~

注:本文转载自juejin.cn的飞哥数智坊的文章"https://juejin.cn/post/7485553588657733667"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2024 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top