Week 11 - 02 - L-Continual Learning视图:倍速:

空格=播放/暂停当前页 · Tab=切换 简短/详细/深入 · 红色「深入」为重点页的深度讲解

第 1 / 44 页

这一页讲的是持续学习(Continual Learning)和人工智能的可持续性,属于课程COMSPCI 713: AI Fundamentals的内容。

第 2 / 44 页

这一页讲的是致谢部分,提到幻灯片内容改编自 Yun Sing Koh 的持续学习(Continual Learning)课程。

第 3 / 44 页

这一页讲的是持续学习(Continual Learning, CL)的课程大纲和学习目标,包括定义、设置及三种技术方法的特点和实例。

第 4 / 44 页

这一页讲的是持续学习(Continual Learning)的核心思想和方法。主要强调学习者连续处理任务,既能获取新知识又能保留旧知识。

第 5 / 44 页

这一页讲的是 Continual Learning(持续学习)的定义和关键技术。主要内容包括数据分布变化中学习的目标,以及三种深度持续学习技术:Replay-based、Regularisation-based 和 Architecture-based。

第 6 / 44 页

这一页讲的是持续学习(Continual Learning)的定义与关键概念,包括知识迁移和灾难性遗忘(Catastrophic Forgetting)。

第 7 / 44 页

这一页讲的是灾难性遗忘 (Catastrophic Forgetting),介绍其定义、优化目标及实践中的挑战。重点提到优化当前任务可能导致对旧任务的性能下降。

第 8 / 44 页

这一页讲的是灾难性遗忘 (Catastrophic Forgetting),包括定义、场景及深度持续学习的技术方法。图表对比了灾难性遗忘与无遗忘的表现差异。

第 9 / 44 页

这一页讲的是稳定性-可塑性困境(Stability-Plasticity Dilemma)。主要介绍了两种目标:稳定性和可塑性,以及它们的平衡问题。

第 10 / 44 页

这一页讲的是数据变化可以发生的地方,包括类别(Class)、领域(Domain)和任务(Task)。

第 11 / 44 页

这一页讲的是模型中的三种可能发生的 shift 类型:Class shift、Domain shift 和 Task shift。

第 12 / 44 页

这一页讲的是持续学习 (Continual Learning) 的三种设置:类别增量学习、领域增量学习和任务增量学习。

第 13 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置,重点介绍类增量学习 (Class-Incremental Learning),它通过逐步接收新的训练类别来扩展模型能力。

第 14 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置,尤其是任务增量学习 (Task-Incremental Learning)。主要内容包括任务序列的处理以及机器人学习新功能的应用场景。

第 15 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置,重点介绍了领域增量学习 (Domain-Incremental Learning) 的特点和应用场景。

第 16 / 44 页

这一页讲的是深度持续学习(Deep Continual Learning)的概述和主要技术分类。重点包括三类技术:Replay-based、Regularisation-based 和 Architecture-based 方法。

第 17 / 44 页

这一页讲的是 Replay Methods 的概念与应用。主要内容包括通过重放旧任务样本来避免遗忘,并适用于 class-incremental 和 domain-incremental 设置。

第 18 / 44 页

这一页讲的是 iCaRL 方法,它是一种增量学习(Incremental Learning)的分类器和表示学习方法。重点包括回放方法(Replay-based)的原理和作用。

第 19 / 44 页

这一页讲的是 iCaRL 方法的核心思想及其在持续学习中的技术特点。主要包括保持样本记忆、更新特征提取器,以及使用最近类别均值分类器。

第 20 / 44 页

这一页讲的是 iCaRL 方法及其在增量学习中的表现。重点包括深度持续学习的技术分类和实验结果对比。

第 21 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM),用于任务增量学习(Task Incremental Learning)。重点包括 GEM 的设计目标、共享特征提取器和任务专属分类器的架构。

第 22 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法,用于深度持续学习。主要内容包括 GEM 的核心思想、梯度干预机制,以及 Episodic Memory 的设计与作用。

第 23 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法及其优化问题。重点包括约束优化公式、episodic memory 的定义,以及如何处理梯度以避免遗忘。

第 24 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法,用于深度连续学习(Deep Continual Learning)。重点包括 GEM 的定义、特点以及其在不同数据集上的表现。

第 25 / 44 页

这一页讲的是 Pseudo-Rehearsal 方法,用随机数据替代旧实例来保持模型对旧任务的表现,同时讨论其优点和问题。

第 26 / 44 页

这一页讲的是伪复习(Pseudo-Rehearsal)技术及其改进——生成重播(Generative Replay)。重点包括使用生成模型生成旧任务数据、提升任务保留效果,以及使用预训练模型降低训练成本。

第 27 / 44 页

这一页讲的是 Regularisation-based 方法在深度持续学习中的应用。重点包括通过正则化项保护过去任务的性能,并与 Replay-based 方法相比的优势。

第 28 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 的概念与知识蒸馏 (Knowledge Distillation) 的应用。主要内容包括如何通过知识蒸馏保留旧任务的知识、教师模型与学生模型的关系,以及蒸馏的优势。

第 29 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 方法,它通过知识蒸馏实现跨任务学习,避免遗忘旧任务。主要过程包括数据处理、记录旧任务输出,以及损失函数的蒸馏增强。

第 30 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 方法及其局限性。主要讨论 LwF 在任务之间数据分布变化时的失败原因,并通过图表展示不同方法的性能表现。

第 31 / 44 页

这一页讲的是权重先验正则化 (Weight Prior Regularisation),通过基于之前学习的权重进行正则化来保持一致性。介绍了 L2 正则化的公式及其问题。

第 32 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法的核心思想及其实现方式。主要内容包括识别重要参数的方法和深度持续学习的技术分类。

第 33 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法,用于深度持续学习。重点包括 EWC 的定义、模型参数如何在任务间平衡,以及图示展示任务 A 和任务 B 的参数空间表现。

第 34 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC),一种用于深度持续学习的正则化方法。重点包括 EWC 的原理、与 L2 正则化的区别,以及如何平衡任务 A 和任务 B 的误差。

第 35 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC),一种用于深度连续学习的正则化方法。重点包括通过惩罚参数变化来防止遗忘,以及公式中各项的含义。

第 36 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法的原理与应用。主要内容包括如何计算参数重要性 Fi、其对模型输出的影响,以及重要性如何影响参数调整难度。

第 37 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法及其局限性。重点包括 EWC 的内存和计算扩展问题、软约束不足、累积漂移以及过参数化敏感性。

第 38 / 44 页

这一页讲的是 Architecture-Based Approaches,用不同的子网络处理不同任务,通过参数冻结避免遗忘问题。

第 39 / 44 页

这一页讲的是基于架构的深度持续学习方法,分为静态架构和动态架构两类。静态架构固定网络大小,动态架构通过添加新模块扩展网络。

第 40 / 44 页

这一页讲的是 PackNet 方法,它属于深度持续学习 (Deep Continual Learning) 的架构方法。主要内容包括权重剪枝与重新分配,以及冻结任务特定权重。

第 41 / 44 页

这一页讲的是 PackNet 方法中的问题与解决方案,重点是有限模型容量问题及其替代方案。

第 42 / 44 页

这一页讲的是 PackNet 方法中解决内存约束问题的方案。主要问题是任务专属掩码需要大量内存,解决方法是用二进制编码简化存储,显著降低内存需求。

第 43 / 44 页

这一页讲的是深度持续学习的总结,包括灾难性遗忘、知识迁移挑战以及下一代 AI 的目标。重点提到开放世界学习的重要性和自主学习代理的构建。

第 44 / 44 页

这一页讲的是持续学习(Continual Learning)的关键概念,包括定义、常见方法及其优缺点,以及三种技术:基于回放、正则化和架构的方法。