DeepSeek V3-0324很不错，这是一些提示词和使用建议

这两天DeepSeek又发布了一个编程能力更强的V3模型，自媒体圈肯定是又被各种震惊。估计大家也是不可避免的都关注到了，所以我这里给大家提供一些更真实的结论和建议。1、实测下DeepSeek V3-0324相比此前的版本确实在前端设计能力上取得了很大的进步，设计审美和生成长代码的能力都增强了许多；2、整体编程能力大致在Claude 3.5到Claude 3.7之间3、目前Cursor中的DeepS

AI入门学堂

538人浏览 · 2025-03-26 14:01:42

AI入门学堂 · 2025-03-26 14:01:42 发布

前言

一、结论&建议

这两天DeepSeek又发布了一个编程能力更强的V3模型，自媒体圈肯定是又被各种震惊。估计大家也是不可避免的都关注到了，所以我这里给大家提供一些更真实的结论和建议。

1、实测下DeepSeek V3-0324相比此前的版本确实在前端设计能力上取得了很大的进步，设计审美和生成长代码的能力都增强了许多；

2、整体编程能力大致在Claude 3.5到Claude 3.7之间

3、目前Cursor中的DeepSeek V3还不是最新版本，但预计很快会接入，不需要花很多时间整自己的API接入方式，价值不大

4、现在使用DeepSeek V3-0324最方便的方式就是DeepSeek官网，可以在一些简单的，只需要少数几个代码文件的任务场景下使用，比如生成app原型，生成简单的html网页等。

二、DeepSeek V3-0324模型跑分

按DeepSeek官方发布的说法是：

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

可以看出从跑分来说，DeepSeek V3-0324确实开始明显领先了，甚至在评估代码能力的LiveCodeBench上超过了Claude 3.7，不过我在之前的文章中：https://t.zsxq.com/Jpher 就和大家提过，现实世界软件工程要解决的问题和编程竞赛类的跑分是不同的，我们真正该关注的两个评测集其实是SWE-Lancer和SWE-Bench Verified，只有这两个集合的评估才真正代表模型的编程能力。可惜这次V3的发布没有这个数据。

三、实际的测试

这两天DeepSeek的编程能力测试很多，有一个小球在六边形里滚动的，那个其实价值一般，还是让模型解决难题。我觉得更有价值的还是让模型能前端页面和完成后端的开发。所以我还是拿了之前尝试过对模型能力要求比较高的app原型测试的提示词，并做了些调整，去要求deepseek一次性生成全部html代码。

我想开发一个类似拼多多的电商平台app，现在需要输出高保真的原型图，请通过以下方式帮我完成所有界面的原型设计，并确保这些原型界面可以直接用于开发：1、用户体验分析：先分析这个 App 的主要功能和用户需求，确定核心交互逻辑。2、产品界面规划：作为产品经理，定义关键界面，确保信息架构合理。3、高保真 UI 设计：作为 UI 设计师，设计贴近真实 iOS/Android 设计规范的界面，使用现代化的 UI 元素，使其具有良好的视觉体验。4、HTML 原型实现：使用 HTML + Tailwind CSS（或 Bootstrap）生成所有原型界面，并使用 FontAwesome（或其他开源 UI 组件）让界面更加精美、接近真实的 App 设计。拆分代码文件，保持结构清晰：5、将所有页面直接平铺展示在 index 页面中，而不是跳转链接。- 真实感增强：- 界面尺寸应模拟 iPhone 15 Pro，并让界面圆角化，使其更像真实的手机界面。- 使用真实的 UI 图片，而非占位符图片（可从 Unsplash、Pexels、Apple 官方 UI 资源中选择）。- 添加顶部状态栏（模拟 iOS 状态栏），并包含 App 导航栏（类似 iOS 底部 Tab Bar）。请按照以上要求生成完整的 HTML 代码，并确保其可用于实际开发。

这个提示词获得了1400多行的代码，但是因为生成的代码文件过长，deepseek在生成时中断过一次，但点击「继续生成」就解决了。