在人工智能领域,模型的迭代更新不断推动着技术的边界。3月24日晚上,DeepSeek 推出了其最新模型 DeepSeek-V3-0324,这一小版本更新不仅在模型参数上有所提升,更在开源协议上做出了重大调整,为开发者带来了更大的自由度和便利性。

模型性能提升

DeepSeek-V3-0324 模型在参数规模上进行了小幅增长,从初代 V3 版本的 6710 亿参数提升至 6850 亿参数。虽然参数增长幅度不大,但性能上的提升却十分显著。特别是在代码能力方面,根据国外开源评测平台 kcores-llm-arena 的最新测试数据显示,DeepSeek-V3-0324 的代码能力达到了 328.3 分,超越了 Claude 3.7 Sonnet(322.3 分),与思维链版本的 Claude 3.7 Sonnet(334.8 分)相近。这表明 DeepSeek-V3-0324 在代码生成和理解方面已经达到了世界领先水平。

开源协议调整

除了模型性能的提升,DeepSeek 还对其开源协议进行了重大调整。DeepSeek-V3-0324 的开源协议更新为与 DeepSeek-R1 一致的 MIT 协议。相较于之前的协议,MIT 协议更加宽松,允许模型蒸馏、商业化等行为。这一调整无疑将极大地促进 DeepSeek-V3-0324 在各个领域的应用和发展。

技术亮点分析

 高效的分布式训练

在大规模分布式训练中,跨节点的通信开销是一个重要的性能瓶颈。DeepSeek-V3-0324 通过确保每个输入最多只能被发送到预设数量的节点上,显著减少了跨节点通信的流量,从而提高了训练效率。

 优化的输出可读性

DeepSeek-V3-0324 基于“数千”个“冷启动”数据进行 SFT(监督微调),这些数据都采用标准格式:| 特殊标记| <推理过程>| 特殊标记| <摘要>。这个方式被设计用来提高模型输出的可读性。

应用前景展望

DeepSeek-V3-0324 的发布,标志着 DeepSeek 在人工智能领域取得了又一项重要突破。其强大的代码能力和宽松的开源协议,将为开发者和企业提供更多创新和应用的可能性。无论是在软件开发、数据分析,还是在人工智能应用开发领域,DeepSeek-V3-0324 都将发挥重要作用。

DeepSeek-V3-0324 的发布,不仅展示了 DeepSeek 在模型性能上的持续进步,也体现了其在开源生态建设上的积极态度。随着 DeepSeek-V3-0324 的广泛应用,人工智能技术将为更多领域带来变革和创新。

测试题

逻辑题

一楼到十楼的每层电梯门口都放着一颗钻石,钻石大小不一。
你乘坐电梯从一楼到十楼,每层楼电梯门都会打开一次,只能拿一次钻石,问怎样才能拿到最大的一颗?

✅先拿下第一楼的钻石,然后在每一楼把手中的钻石与那一楼的钻石相比较,如果那一楼的钻石比手中的钻石大的话那就把手中的钻石换成那一层的钻石。

 Text to SQL 能力

创建产品表
cursor.execute('''
CREATE TABLE products (
product_id INTEGER PRIMARY KEY,
product_name TEXT NOT NULL,
category TEXT NOT NULL,
unit_price REAL NOT NULL,
cost_price REAL NOT NULL,
current_stock INTEGER NOT NULL,
min_stock_level INTEGER NOT NULL
)
''')

创建进货表
cursor.execute('''
CREATE TABLE purchases (
purchase_id INTEGER PRIMARY KEY,
product_id INTEGER NOT NULL,
supplier_id INTEGER NOT NULL,
purchase_date TEXT NOT NULL,
quantity INTEGER NOT NULL,
unit_cost REAL NOT NULL,
total_cost REAL NOT NULL,
FOREIGN KEY (product_id) REFERENCES products (product_id),
FOREIGN KEY (supplier_id) REFERENCES suppliers (supplier_id)
)
''')

创建销售表
cursor.execute('''
CREATE TABLE sales (
sale_id INTEGER PRIMARY KEY,
product_id INTEGER NOT NULL,
customer_id INTEGER,
sale_date TEXT NOT NULL,
quantity INTEGER NOT NULL,
unit_price REAL NOT NULL,
total_price REAL NOT NULL,
FOREIGN KEY (product_id) REFERENCES products (product_id)
)
''')

创建供应商表
cursor.execute('''
CREATE TABLE suppliers (
supplier_id INTEGER PRIMARY KEY,
supplier_name TEXT NOT NULL,
contact_person TEXT,
phone TEXT,
email TEXT,
address TEXT
)
''')

创建客户表
cursor.execute('''
CREATE TABLE customers (
customer_id INTEGER PRIMARY KEY,
customer_name TEXT NOT NULL,
contact_person TEXT,
phone TEXT,
email TEXT,
address TEXT
)
''')

生成随机数据
供应商数据
suppliers_data = [
(1, '北京供应有限公司', '张三', '13800000001', 'supplier1@example.com', '北京市海淀区'),
(2, '上海优质货源公司', '李四', '13800000002', 'supplier2@example.com', '上海市浦东新区'),
(3, '广州原材料供应商', '王五', '13800000003', 'supplier3@example.com', '广州市天河区'),
(4, '深圳电子零件公司', '赵六', '13800000004', 'supplier4@example.com', '深圳市南山区'),
(5, '杭州科技供应链', '钱七', '13800000005', 'supplier5@example.com', '杭州市西湖区')
]

客户数据
customers_data = [
(1, '第一商场', '陈一', '13900000001', 'customer1@example.com', '北京市朝阳区'),
(2, '二号连锁超市', '刘二', '13900000002', 'customer2@example.com', '上海市静安区'),
(3, '三星电子经销商', '孙三', '13900000003', 'customer3@example.com', '广州市越秀区'),
(4, '四方百货公司', '周四', '13900000004', 'customer4@example.com', '深圳市福田区'),
(5, '五洲商贸中心', '吴五', '13900000005', 'customer5@example.com', '杭州市拱墅区'),
(6, '六合连锁店', '郑六', '13900000006', 'customer6@example.com', '成都市锦江区'),
(7, '七彩电器城', '王七', '13900000007', 'customer7@example.com', '重庆市渝中区'),
(8, '八方食品公司', '冯八', '13900000008', 'customer8@example.com', '武汉市江汉区')
]

产品数据
products_data = [
(1, '笔记本电脑A型', '电子产品', 5999.00, 4500.00, 50, 10),
(2, '智能手机X1', '电子产品', 3999.00, 2800.00, 120, 20),
(3, '办公桌椅套装', '办公家具', 1299.00, 800.00, 30, 5),
(4, '激光打印机P3', '办公设备', 1599.00, 1100.00, 25, 8),
(5, '液晶显示器27寸', '电子产品', 1299.00, 900.00, 60, 15),
(6, '机械键盘K8', '电子配件', 399.00, 250.00, 100, 30),
(7, '无线鼠标M2', '电子配件', 199.00, 120.00, 150, 40),
(8, '移动硬盘1TB', '存储设备', 499.00, 350.00, 80, 20),
(9, '办公文件柜', '办公家具', 899.00, 600.00, 15, 5),
(10, '投影仪H1', '办公设备', 2999.00, 2200.00, 10, 3),
(11, '复印纸A4', '办公耗材', 39.90, 25.00, 500, 100),
(12, '墨盒套装', '办公耗材', 299.00, 180.00, 70, 20),
(13, '电脑包', '配件', 199.00, 120.00, 90, 30),
(14, 'USB集线器', '电子配件', 99.00, 60.00, 120, 40),
(15, '无线耳机', '电子配件', 599.00, 400.00, 85, 25)
]

找出所有库存低于最小库存水平的产品,直接给出SQL语句,不需要解释

对比各产品的进货量和销售量,找出库存周转率最高的5种产品,直接给出sql语句,不要解释

查询所有单价超过1000元的产品及其类别,直接给出sql语句,不要解释

分析每种产品在不同月份的销售情况,并计算同比增长率,直接给出sql语句,不要解释

文档分析能力

在针对 AIME 基准的推理增强实验中,经过完整训练流程(包括 Roll-Out DPO)后的 Phi-4-Mini 获得了 50.0 的得分,相比基线 Phi-4-Mini 的得分提高了 40.0 个百分点。

Phi-4-Mini 的配置
  -Transformer 层数:32 层
  -隐藏状态大小:3,072
  -GQA 配置:24 个查询头和 8 个键/值头

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐