京东二面：DeepSeek为何要用FP8而不是INT8？

最近已有不少大厂开启春招宣讲了。节前，我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。随着DeepSeek爆火，面试中也越来越高频出现，因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练，Dual-Pipe等关键

Python算法实战

1195人浏览 · 2025-03-22 17:15:45

Python算法实战 · 2025-03-22 17:15:45 发布

最近已有不少大厂开启春招宣讲了。

节前，我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。

总结链接如下：

《大模型面试宝典》(2025版) 正式发布

在这里插入图片描述

随着DeepSeek爆火，面试中也越来越高频出现，因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练，Dual-Pipe等关键技术，力求做到全网最硬核的解析~

本文介绍 DeepSeek 中大量使用的一种数据编码方式——FP8。FP8 是 Float8 的简写，中文可以称之为 8 位浮点数，也就是用 8 位的空间来存储一个浮点数。

本文将从什么是 FP8 的基本结构开始，举例讲解如何将一个十进制的小数转换为 FP8 的格式。同时，也会演示如何将一个 FP8 的数据转换回一个十进制的数。

接下来，我们会介绍 FP8 的基本计算原理，包括如何进行加减乘除运算。相信通过本文的介绍，读者应该会对 FP8 有一个基本的了解。

01 FP8的基本结构

FP8 是一种 8 位浮点数格式，专为深度学习计算设计。与传统的 32 位浮点数（FP32）相比，它大幅减少了存储空间和计算负担，同时为 AI 任务保留了足够的精度。

FP8 主要有两种常见规格：

E4M3：1 位符号位 + 4 位指数位 + 3 位尾数位
E5M2：1 位符号位 + 5 位指数位 + 2 位尾数位

02 FP8和十进制如何转换

FP8 遵循 IEEE 浮点数的基本原理，一个 FP8 数的值计算为：

(-1)^符号位 × (1.尾数) × 2^(指数-偏置值)

其中 E4M3 格式的偏置值为 7(2^(4-1)-1)。

实例：十进制转 FP8

以 0.15625 为例，如何转换为 FP8（E4M3）格式？

确定符号位：0.15625 为正数，符号位为 0
二进制转换：0.15625 = 0.00101(二进制) = 1.01 × 2^(-3)
计算指数：实际指数为 -3，加上偏置值 7 得到 E = 4（二进制 0100）
提取尾数：尾数为 01，补齐三位为 010
组合结果：0|0100|010 = 00100010（二进制）

这样，0.15625 就被编码为 00100010 这个 8 位二进制数。

实例：FP8 转十进制

如果我们看到 FP8 数 01100010，如何转换回十进制？

分解各部分：

符号位 S = 0（正数）
指数位 E = 1100(二进制) = 12（十进制）
尾数位 M = 010

计算实际值：

实际指数 = 12 - 7 = 5
尾数转换为十进制： 1.010 = 1 * 2^0 + 1*2^(-2) = 1+0.25 = 1.25
最终，真实值 = 1 × 1.25 × 2^5
= 1 × 1.25 × 32
= 40

03 计算原理

高能预警：本节内容存在大量计算，需要读者掌握一些基本的计算机组成原理知识。包括但不限于：进制转换速算、计算机组成原理等。

限于篇幅，无法将所有先验知识一一写明，读者请酌情阅读下列内容。如果写得不清楚的地方，欢迎读者在文章评论区提问，作者会及时回复。

本节用 2 个 FP8 数值为用户举例讲解两个 FP8 的数据如何进行计算。

两个数值的对应信息见下表：

尾数真实值需要补充隐含的 1。

加减

加减的计算规则按照：

处理符号位：同号加法结果符号与操作数相同，异号加法结果符号跟随绝对值较大的操作数，用绝对值较大的数减去绝对值较小的数。减法将第二个操作数的符号取反，然后按加法规则处理。
将较小指数的操作数的尾数右移相应位数，将两个操作数的指数变换成相同。
对齐后的尾数按照普通二进制的加减规则进行加减（即加法直接相加，减法取补码后相加）
将尾数真实值规格化到 [1,2) 之间。如果结果尾数 ≥2，需要右移一位并将指数加 1 。如果结果尾数 <1，需要左移直到尾数 ≥1，并相应减小指数。