知识蒸馏主要分两类:

1:基于logits

2:基于feature

logits蒸馏主要是在早期,后期效果逐步被基于feature蒸馏超越。

cvpr2022的DKD基于传统的KD进行改进,重铸logits蒸馏的荣光。目前很多蒸馏都采用DKD方案,比如PaddleClass里面的模型,paddle-ocr等等。

目前基于 这个仓库在cifar100上进行验证:代码简洁明了https://github.com/Daeen/DKD-on-simple-models/blob/main/resnet50_vs_MobileNetV2.py

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐