【NeurIPS2024】跨域知识蒸馏登顶会啦！

论文地址：https://papers.nips.cc/paper_files/paper/2024/hash/5424f6b74f475ad738b54888d609283a-Abstract-Conference.html代码地址：https://github.com/xuqing88/Reinforced-Cross-Domain-Knowledge-Distillation-on-Time

朝阳区靓仔_James

974人浏览 · 2025-04-11 15:09:03

朝阳区靓仔_James · 2025-04-11 15:09:03 发布

论文题目：Reinforced Cross-Domain Knowledge Distillation on Time Series Data

论文地址：https://papers.nips.cc/paper_files/paper/2024/hash/5424f6b74f475ad738b54888d609283a-Abstract-Conference.html

代码地址：https://github.com/xuqing88/Reinforced-Cross-Domain-Knowledge-Distillation-on-Time-Series-Data

创新点

本文提出了一种基于强化学习的模块，能够根据学生模型的当前学习能力动态选择适合的知识传递的目标域样本。
RCD-KD 通过引入不确定性一致性（uncertainty consistency）作为样本选择的依据，确保学生模型在选择样本时能够与教师模型保持一致的不确定性水平。
RCD-KD 将不确定性一致性和样本可转移性结合起来，设计了一个新颖的奖励函数，用于动态选择目标域样本。

方法

本文提出了一种名为 Reinforced Cross-Domain Knowledge Distillation (RCD-KD) 的框架，旨在解决时间序列数据中的跨域适应问题，同时降低模型复杂度以适应资源受限的设备。RCD-KD 的核心思想是通过动态选择适合的目标域样本进行知识传递，以及利用领域不变知识的传递来提高学生模型在目标域上的泛化能力。

RCD-KD 框架的整体架构

本图中详细描述了 RCD-KD 的核心模块，包括教师模型（Teacher）、学生模型（Student）、领域判别器（Domain Discriminator）和基于强化学习的样本选择模块（Dueling DDQN）。教师模型通过蒙特卡洛 Dropout (MCD) 模块生成不确定性估计，用于计算奖励函数。学生模型通过领域判别器学习领域不变的知识，并通过强化学习模块动态选择适合的目标域样本进行知识传递。图中还展示了状态、动作（和奖励的流动，以及如何通过 Dueling DDQN 优化样本选择策略。

教师模型、学生模型和领域判别器的网络架构

本图展示了教师模型、学生模型和领域判别器的网络架构。

(a) 1D-CNN Teacher：教师模型由三个堆叠的 1D 卷积块组成，每个卷积块包括一个 1D 卷积层、BatchNorm 层、ReLU 激活层、1D 最大池化层和 Dropout 层。最后是一个全连接层作为分类器。
(b) 1D-CNN Student：学生模型的架构与教师模型类似，但参数更少，卷积层的输出通道数更少。
© Domain Discriminator：领域判别器由三个线性层组成，每个线性层后接一个 ReLU 激活层。输出是一个二分类概率分布，用于判断特征图是否来自教师模型（使用源域数据）或学生模型（使用目标域数据）。

TCN → 1D-CNN

本图中比较了不同方法在多个数据集上的性能，包括 HAR、HHAR、FD 和 SSC。RCD-KD 在所有数据集上均优于其他基准方法，显示出其在不同教师-学生模型配置下的有效性。

实验结果

本表详细展示了本文提出的强化跨域知识蒸馏（RCD-KD）方法与其他基于知识蒸馏的领域自适应（DA）方法在人类活动识别（HAR）和异构人类活动识别（HHAR）数据集上的性能对比。表中列出了多种方法在不同转移场景下的宏 F1 分数（Macro F1-scores），这些分数反映了模型在目标域上的泛化能力。本文通过详细的实验结果，清晰地展示了 RCD-KD 方法在 HAR 和 HHAR 数据集上的优越性能。与其他方法相比，RCD-KD 通过强化学习模块和领域判别器的结合，能够更有效地根据学生模型的学习能力动态选择目标样本，并转移适合的知识，从而提高学生模型在目标域上的泛化能力。这些结果不仅证明了 RCD-KD 在处理领域自适应问题时的有效性，还表明其在降低模型复杂度的同时，能够保持较高的性能，使其更适合在资源受限的设备上部署。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述