Week 11 - 02 - L-Continual Learning

第 1 / 44 页

这一页讲的是持续学习（Continual Learning）和人工智能的可持续性，属于课程COMSPCI 713: AI Fundamentals的内容。

第 2 / 44 页

这一页讲的是致谢部分，提到幻灯片内容改编自 Yun Sing Koh 的持续学习（Continual Learning）课程。

第 3 / 44 页

这一页讲的是持续学习（Continual Learning, CL）的课程大纲和学习目标，包括定义、设置及三种技术方法的特点和实例。

第 4 / 44 页

这一页讲的是持续学习（Continual Learning）的核心思想和方法。主要强调学习者连续处理任务，既能获取新知识又能保留旧知识。

第 5 / 44 页

这一页讲的是 Continual Learning（持续学习）的定义和关键技术。主要内容包括数据分布变化中学习的目标，以及三种深度持续学习技术：Replay-based、Regularisation-based 和 Architecture-based。

第 6 / 44 页

这一页讲的是持续学习(Continual Learning)的定义与关键概念，包括知识迁移和灾难性遗忘(Catastrophic Forgetting)。

第 7 / 44 页

这一页讲的是灾难性遗忘 (Catastrophic Forgetting)，介绍其定义、优化目标及实践中的挑战。重点提到优化当前任务可能导致对旧任务的性能下降。

第 8 / 44 页

这一页讲的是灾难性遗忘 (Catastrophic Forgetting)，包括定义、场景及深度持续学习的技术方法。图表对比了灾难性遗忘与无遗忘的表现差异。

第 9 / 44 页

这一页讲的是稳定性-可塑性困境(Stability-Plasticity Dilemma)。主要介绍了两种目标：稳定性和可塑性，以及它们的平衡问题。

第 10 / 44 页

这一页讲的是数据变化可以发生的地方，包括类别（Class）、领域（Domain）和任务（Task）。

第 11 / 44 页

这一页讲的是模型中的三种可能发生的 shift 类型:Class shift、Domain shift 和 Task shift。

第 12 / 44 页

这一页讲的是持续学习 (Continual Learning) 的三种设置:类别增量学习、领域增量学习和任务增量学习。

第 13 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置，重点介绍类增量学习 (Class-Incremental Learning)，它通过逐步接收新的训练类别来扩展模型能力。

第 14 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置，尤其是任务增量学习 (Task-Incremental Learning)。主要内容包括任务序列的处理以及机器人学习新功能的应用场景。

第 15 / 44 页

这一页讲的是持续学习 (Continual Learning) 的设置，重点介绍了领域增量学习 (Domain-Incremental Learning) 的特点和应用场景。

第 16 / 44 页

这一页讲的是深度持续学习(Deep Continual Learning)的概述和主要技术分类。重点包括三类技术：Replay-based、Regularisation-based 和 Architecture-based 方法。

第 17 / 44 页

这一页讲的是 Replay Methods 的概念与应用。主要内容包括通过重放旧任务样本来避免遗忘，并适用于 class-incremental 和 domain-incremental 设置。

第 18 / 44 页

这一页讲的是 iCaRL 方法，它是一种增量学习（Incremental Learning）的分类器和表示学习方法。重点包括回放方法（Replay-based）的原理和作用。

第 19 / 44 页

这一页讲的是 iCaRL 方法的核心思想及其在持续学习中的技术特点。主要包括保持样本记忆、更新特征提取器，以及使用最近类别均值分类器。

第 20 / 44 页

这一页讲的是 iCaRL 方法及其在增量学习中的表现。重点包括深度持续学习的技术分类和实验结果对比。

第 21 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM)，用于任务增量学习(Task Incremental Learning)。重点包括 GEM 的设计目标、共享特征提取器和任务专属分类器的架构。

第 22 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法，用于深度持续学习。主要内容包括 GEM 的核心思想、梯度干预机制，以及 Episodic Memory 的设计与作用。

第 23 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法及其优化问题。重点包括约束优化公式、episodic memory 的定义，以及如何处理梯度以避免遗忘。

第 24 / 44 页

这一页讲的是 Gradient Episodic Memory (GEM) 方法，用于深度连续学习（Deep Continual Learning）。重点包括 GEM 的定义、特点以及其在不同数据集上的表现。

第 25 / 44 页

这一页讲的是 Pseudo-Rehearsal 方法，用随机数据替代旧实例来保持模型对旧任务的表现，同时讨论其优点和问题。

第 26 / 44 页

这一页讲的是伪复习(Pseudo-Rehearsal)技术及其改进——生成重播(Generative Replay)。重点包括使用生成模型生成旧任务数据、提升任务保留效果，以及使用预训练模型降低训练成本。

第 27 / 44 页

这一页讲的是 Regularisation-based 方法在深度持续学习中的应用。重点包括通过正则化项保护过去任务的性能，并与 Replay-based 方法相比的优势。

第 28 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 的概念与知识蒸馏 (Knowledge Distillation) 的应用。主要内容包括如何通过知识蒸馏保留旧任务的知识、教师模型与学生模型的关系，以及蒸馏的优势。

第 29 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 方法，它通过知识蒸馏实现跨任务学习，避免遗忘旧任务。主要过程包括数据处理、记录旧任务输出，以及损失函数的蒸馏增强。

第 30 / 44 页

这一页讲的是 Learning without Forgetting (LwF) 方法及其局限性。主要讨论 LwF 在任务之间数据分布变化时的失败原因，并通过图表展示不同方法的性能表现。

第 31 / 44 页

这一页讲的是权重先验正则化 (Weight Prior Regularisation)，通过基于之前学习的权重进行正则化来保持一致性。介绍了 L2 正则化的公式及其问题。

第 32 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法的核心思想及其实现方式。主要内容包括识别重要参数的方法和深度持续学习的技术分类。

第 33 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法，用于深度持续学习。重点包括 EWC 的定义、模型参数如何在任务间平衡，以及图示展示任务 A 和任务 B 的参数空间表现。

第 34 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC)，一种用于深度持续学习的正则化方法。重点包括 EWC 的原理、与 L2 正则化的区别，以及如何平衡任务 A 和任务 B 的误差。

第 35 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC)，一种用于深度连续学习的正则化方法。重点包括通过惩罚参数变化来防止遗忘，以及公式中各项的含义。

第 36 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法的原理与应用。主要内容包括如何计算参数重要性 Fi、其对模型输出的影响，以及重要性如何影响参数调整难度。

第 37 / 44 页

这一页讲的是 Elastic Weight Consolidation (EWC) 方法及其局限性。重点包括 EWC 的内存和计算扩展问题、软约束不足、累积漂移以及过参数化敏感性。

第 38 / 44 页

这一页讲的是 Architecture-Based Approaches，用不同的子网络处理不同任务，通过参数冻结避免遗忘问题。

第 39 / 44 页

这一页讲的是基于架构的深度持续学习方法，分为静态架构和动态架构两类。静态架构固定网络大小，动态架构通过添加新模块扩展网络。

第 40 / 44 页

这一页讲的是 PackNet 方法，它属于深度持续学习 (Deep Continual Learning) 的架构方法。主要内容包括权重剪枝与重新分配，以及冻结任务特定权重。

第 41 / 44 页

这一页讲的是 PackNet 方法中的问题与解决方案，重点是有限模型容量问题及其替代方案。

第 42 / 44 页

这一页讲的是 PackNet 方法中解决内存约束问题的方案。主要问题是任务专属掩码需要大量内存，解决方法是用二进制编码简化存储，显著降低内存需求。

第 43 / 44 页

这一页讲的是深度持续学习的总结，包括灾难性遗忘、知识迁移挑战以及下一代 AI 的目标。重点提到开放世界学习的重要性和自主学习代理的构建。

第 44 / 44 页

这一页讲的是持续学习(Continual Learning)的关键概念，包括定义、常见方法及其优缺点，以及三种技术：基于回放、正则化和架构的方法。