这一页讲的是演讲的整体框架,分为两个主要部分。第一部分是 ML4SG 概念(Machine Learning for Social Good),重点介绍其基础、技术范式转变以及社会公益研究的核心挑战。这部分旨在帮助理解如何将机器学习技术应用于解决社会问题,并推动技术与公益目标的结合。第二部分是 MARS Lab 和案例研究,主要聚焦于三个领域:野生动物 ReID(Re-identification,旗舰项目)、气候韧性(Climate Resilience)以及算法公平性(Algorithmic Fairness)。这些案例展示了机器学习在实际应用中的多样化场景,例如野生动物身份识别如何保护生态环境,气候韧性研究如何应对气候变化,以及算法公平性如何促进技术的伦理性。这一议程为后续内容奠定了清晰的结构和重点方向。
这一页讲的是技术范式的转变,比较了传统机器学习(Standard ML Paradigm)与面向社会公益的机器学习(ML4SG Paradigm Shift)。
这一页讲的是技术范式的转变,重点比较了传统机器学习(Standard ML Paradigm)与面向社会公益的机器学习(ML4SG Paradigm Shift)在数据特性、目标和动态变化上的不同。首先,数据特性方面,传统机器学习依赖静态、经过筛选的干净标签数据,而ML4SG则处理流式、噪声较大且标签稀疏的数据。其次,在目标上,传统机器学习以最大化平均准确率为核心,而ML4SG更注重优化公平性和安全性,体现了社会责任的导向。最后,在动态变化上,传统机器学习假设数据分布是独立同分布(I.I.D.)且稳定的,而ML4SG需要应对频繁的概念漂移和演化。这种转变反映了机器学习从技术驱动向社会影响驱动的进化。例如,ML4SG可能用于实时监测公共健康数据,处理噪声和不完整信息以保证决策的公平性和安全性。
这一页讲的是 ML for Social Good(ML4SG)与标准机器学习范式之间的三大核心差异,用对比表格的形式列出,是本讲最有考试价值的一页。第一个维度是"数据性质(Data Nature)":标准 ML 假设数据是静态的、经过人工整理的、标注干净的(Static, curated, clean labels);而 ML4SG 面对的是流式数据、噪声大、ground truth 极度稀疏(Streaming, noisy, sparse ground truth)。真实社会场景中,比如用摄像头陷阱监测野生动物,你不可能让专家把每一张图都打上精确标签,数据随时在产生,标注永远跟不上采集速度。第二个维度是"优化目标(Objective)":标准 ML 追求平均准确率最大化(Maximize average accuracy),这在均匀分布的测试集上很好用;ML4SG 必须优化公平性和安全性(Optimize for equity and safety),因为模型犯错的代价在不同群体之间是不对称的——对边缘群体的误判可能造成真实伤害。第三个维度是"数据分布动态(Dynamics)":标准 ML 假设训练集和测试集同分布(I.I.D.,即 Independent and Identically Distributed),分布是稳定的;ML4SG 必须处理频繁的 Concept Drift 和 Distribution Evolution(概念漂移与分布演化)。考试常见考法是:给你一个场景,问它属于哪种范式,或问 I.I.D. 假设为什么在社会场景下不成立。易错点在于混淆"平均准确率高"与"公平性好"——前者完全可以靠牺牲少数群体来实现。记住这张表就掌握了 ML4SG 的底层逻辑。
这一页讲的是 MARS Lab 生命周期的五个阶段,包括 Collaborate、Frame、Design、Verify 和 Deploy。
这一页讲的是 MARS Lab 生命周期的五个阶段,分别是:1. Collaborate(协作),与领域专家和利益相关者合作,确保项目目标和需求清晰;2. Frame(框定),定义项目的影响和约束条件,明确问题范围;3. Design(设计),进行严格的算法研究,开发解决方案;4. Verify(验证),在真实世界系统中测试算法的效果和可靠性;5. Deploy(部署),将经过验证的解决方案应用于实际场景,确保其可持续性。这一流程强调了从问题定义到解决方案实施的系统性方法,确保技术成果能够满足实际需求并产生长期价值。例如,在能源领域,可以通过与专家协作定义需求,设计优化算法,验证其在能源管理系统中的有效性,最终部署到太阳能发电场中实现节能目标。
第 11 / 31 页
这一页讲的是 MARS Lab 的核心理念,强调机器学习 (ML) 应用于社会公益的目标不是追求复杂性,而是构建稳健且公平的模型,真正惠及社区。
这一页讲的是 MARS Lab 的哲学理念,重点在于机器学习 (ML) 应用于社会公益的目标。核心思想是,模型的复杂性并非最重要的追求,真正的价值在于模型的稳健性 (robustness) 和公平性 (equity)。稳健性意味着模型在不同环境或数据条件下都能保持可靠的性能;公平性则强调模型能够平等地服务于不同群体,避免偏见和歧视。更重要的是,这些模型必须能够实际应用于社区,解决真实问题,而不是停留在理论层面。这个理念提醒我们,技术的最终目标是服务于社会,而非仅仅炫耀技术能力。例如,在医疗领域,开发一个简单但可靠的诊断模型,能够帮助资源匮乏地区的患者,比一个复杂但无法落地的模型更有意义。
第 12 / 31 页
这一页讲的是 MARS Lab 和案例研究,展示了实验室的高科技环境及其数据分析能力。
这一页讲的是 MARS Lab 和案例研究,重点介绍了实验室的高科技环境及其在数据处理和分析中的应用。从图片中可以看到一个现代化的控制中心,配备多个显示屏,屏幕上显示复杂的图表和数据分析结果。这些图表可能包括趋势分析、分布图以及网络结构等,表明实验室可以处理多维度的数据。此外,图片中的虚拟动物(例如豹子和大象)可能象征着实验室在生物数据或生态系统研究中的应用。这个实验室的设计和功能体现了数据驱动的科学研究的重要性,强调了通过技术手段连接自然与科学的能力。例如,实验室可能用于追踪动物行为模式或预测生态变化。这种环境为研究者提供了强大的工具支持,能够更高效地解决复杂问题。
第 13 / 31 页
这一页讲的是MARS实验室团队的两位负责人。分别是Prof. Yun Sing Koh和Prof. Gillian Dobbie。
这一页讲的是MARS实验室团队的组成,重点介绍了两位负责人。Prof. Yun Sing Koh和Prof. Gillian Dobbie是MARS实验室的主管(Director of MARS Lab)。这一页通过展示他们的照片和名字,突出了他们在实验室中的领导角色。这些信息表明MARS实验室由两位经验丰富的学者共同领导,强调了团队的专业性和学术背景。这种领导结构通常有助于推动实验室在研究方向上的多样性和深度。
第 14 / 31 页
这一页讲的是 Centre for ML4SG 的核心理念,包括合作、使命和社区。重点是通过跨学科合作解决社会问题,推动机器学习研究与实际应用领域的结合。
这一页讲的是 Centre for ML4SG (Machine Learning for Social Good) 的目标与价值。这是新西兰首个专注于社会公益的机器学习中心,旨在通过跨学科合作解决高影响力的社会问题。页面重点提到三个核心理念:第一是 Collaboration (合作),强调弥合机器学习研究人员与领域专家之间的差距,从而实现技术与实际需求的结合;第二是 Mission (使命),致力于为最具挑战性的问题催化解决方案;第三是 Community (社区),着眼于赋能下一代,为未来培养更多具有社会责任感的技术人才。此外,底部强调了该中心的宗旨,即通过协作研究解决社会问题,并作为奥克兰大学的跨学科卓越中心。这一机构的存在说明机器学习不仅是技术领域的创新工具,也可以成为解决社会问题的重要力量,例如预测自然灾害或优化医疗资源分配。
这一页讲的是 CARE Toolkit 软件,利用 CLIP 模型进行动物身份再识别。重点包括语义特征对齐、局部部署和减少人工干预。
这一页讲的是 CARE Toolkit 软件,它采用 CLIP-based Animal RE-identification(动物身份再识别)技术,旨在解决生物多样性保护中的关键问题——识别个体动物。传统方法在高个体内差异和低个体间差异情况下表现不佳,而 CARE 通过将个体级语义特征与视觉表示对齐,并结合图像条件的文本描述,有效缓解视觉歧义。右侧的流程图展示了 CARE Toolkit 的工作流程,包括用户通过图形界面上传图像,生成检测库和身份库,最终利用动物身份再识别模型完成匹配。软件的特点包括语义特征对齐(Semantic Feature Alignment)、局部托管系统(Locally Hosted Software System)和最少人工干预(Minimal Human Intervention)。此外,系统显著减少了野生动物监测中的标注工作量和人工错误风险,支持大规模相机陷阱数据处理。这种工具对于实际的野生动物保护和监测具有重要意义。
这一页讲的是通过以儿童为中心的多模态数据收集,研究新西兰青年(rangatahi)的多样化生活经历,以提供健康政策制定的依据。目标是通过文化视角理解青少年的成长旅程。方法上,使用 LLM 支持的主题分析(Thematic-LM)和视觉-语言模型,分析大规模的定性数据,同时确保文化背景的融入。影响在于将这些叙述转化为及时且与政策相关的证据,关注身份和参与度,同时保留真实生活经历的细腻性。合作方面,这个项目由奥克兰大学支持,扩展了“在新西兰成长”纵向研究(Growing Up in New Zealand longitudinal study),并结合了毛利文化视角(te ao Māori lens)。页面底部的关键词“Longitudinal Study”“Child Development”“Health & Wellbeing”强调了研究的核心领域。