前言

一、结论&建议

这两天DeepSeek又发布了一个编程能力更强的V3模型,自媒体圈肯定是又被各种震惊。估计大家也是不可避免的都关注到了,所以我这里给大家提供一些更真实的结论和建议。

1、实测下DeepSeek V3-0324相比此前的版本确实在前端设计能力上取得了很大的进步,设计审美和生成长代码的能力都增强了许多;

2、整体编程能力大致在Claude 3.5到Claude 3.7之间

3、目前Cursor中的DeepSeek V3还不是最新版本,但预计很快会接入,不需要花很多时间整自己的API接入方式,价值不大

4、现在使用DeepSeek V3-0324最方便的方式就是DeepSeek官网,可以在一些简单的,只需要少数几个代码文件的任务场景下使用,比如生成app原型,生成简单的html网页等。

二、DeepSeek V3-0324模型跑分

按DeepSeek官方发布的说法是:

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

图片

可以看出从跑分来说,DeepSeek V3-0324确实开始明显领先了,甚至在评估代码能力的LiveCodeBench上超过了Claude 3.7,不过我在之前的文章中:https://t.zsxq.com/Jpher 就和大家提过,现实世界软件工程要解决的问题和编程竞赛类的跑分是不同的,我们真正该关注的两个评测集其实是SWE-Lancer和SWE-Bench Verified,只有这两个集合的评估才真正代表模型的编程能力。可惜这次V3的发布没有这个数据。

三、实际的测试

这两天DeepSeek的编程能力测试很多,有一个小球在六边形里滚动的,那个其实价值一般,还是让模型解决难题。我觉得更有价值的还是让模型能前端页面和完成后端的开发。所以我还是拿了之前尝试过对模型能力要求比较高的app原型测试的提示词,并做了些调整,去要求deepseek一次性生成全部html代码。

我想开发一个类似拼多多的电商平台app,现在需要输出高保真的原型图,请通过以下方式帮我完成所有界面的原型设计,并确保这些原型界面可以直接用于开发:1、用户体验分析:先分析这个 App 的主要功能和用户需求,确定核心交互逻辑。2、产品界面规划:作为产品经理,定义关键界面,确保信息架构合理。3、高保真 UI 设计:作为 UI 设计师,设计贴近真实 iOS/Android 设计规范的界面,使用现代化的 UI 元素,使其具有良好的视觉体验。4、HTML 原型实现:使用 HTML + Tailwind CSS(或 Bootstrap)生成所有原型界面,并使用 FontAwesome(或其他开源 UI 组件)让界面更加精美、接近真实的 App 设计。拆分代码文件,保持结构清晰:5、将所有页面直接平铺展示在 index 页面中,而不是跳转链接。- 真实感增强:- 界面尺寸应模拟 iPhone 15 Pro,并让界面圆角化,使其更像真实的手机界面。- 使用真实的 UI 图片,而非占位符图片(可从 Unsplash、Pexels、Apple 官方 UI 资源中选择)。- 添加顶部状态栏(模拟 iOS 状态栏),并包含 App 导航栏(类似 iOS 底部 Tab Bar)。请按照以上要求生成完整的 HTML 代码,并确保其可用于实际开发。

这个提示词获得了1400多行的代码,但是因为生成的代码文件过长,deepseek在生成时中断过一次,但点击「继续生成」就解决了。

图片

获得的实际效果如下:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

另外,我还尝试了个网站的生成,效果也还可以,大致都是属于Claude 3.5到Claude 3.7之间的水平。

在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐