Skip to content
知识

/knowledge/data-science-mentoring

数据科学带教

我在教它的过程中所学到的。本板块的每一页都是一个我得先讲给别人听的主题——而讲解它,正是我真正理解它之处。

学于
数据科学带教讲授 · 墨尔本大学同伴带教 2024
时间
墨尔本大学 · 澳国立 · 2024
应用于
教学是贯穿线
阅读 / 复习
约 12 分钟阅读2026-06-25

本板块的其他每一页,都是从一个学过该主题的人的座位上写的。这一页是从另一个座位上 写的——那个你得让别人理解它的座位。我通过墨尔本大学的同伴带教项目和澳国立的 Analytics Plus 项目带教数据科学的学生,而这改变了我看待整个领域的方式。

教学最大的意外,是它教会多少。你无法解释你只懂一半的东西——你自己知识里的缺口, 会在一个学生问「可是为什么?」的那一刻浮现。这一页是本板块其余部分的反思性对应物:不是一个 我学过的主题,而是「学着去教这些主题」教会了我的东西。

01

从书桌的另一边

带教数据科学不同于辅导单一科目,因为这个领域太广,而学习者来自四面八方——怕代码的数学 人、怕统计的程序员、对两者都陌生的领域专家。这份工作不是灌输事实;而是帮一个人建起一个 他们能自行扩展的心智模型。一个好的带教者,会把自己做到失业。

这重新框定了下面的一切。一次辅导的目标不是回答你面前的那个问题——而是让学生在没有你的 情况下,对下一个问题更有能力一点。独立,而非依赖,才是衡量标准。

02

学习者在哪里卡住

辅导得足够多之后,你会一次次看到同样的墙,而它们几乎没有一个是关于智力的:

  • 数学焦虑之墙——一个深信自己「不是数学的料」的学习者,在一个公式前僵住,而 那公式若先用文字拆解开来,他们本是能懂的。这道阻碍,在成为技术性之前,先是情绪性的。
  • 工具执念——纠结于用哪个库、哪个模型,而不去问他们究竟想回答什么问题。他们 要的是先「怎么做」、后「做什么」,这是反的(问题 优先的教训)。
  • 照着教程走却不理解——他们能把一个笔记本从头跑到尾、感觉很有成效,但改动一处 它就垮了,因为他们跟着的是步骤,而非抓住了那些步骤为什么奏效。

认出某人撞的是哪道墙,比懂材料更要紧,因为应对方式完全不同。数学焦虑的学习者需要安抚与 直觉;工具执念的学习者需要被拉回到问题上;照教程走的人需要被要求在运行之前先预测。

03

把难的东西讲简单

带教的核心手艺,是把难的东西讲简单、又不讲错。几个技巧承担了大部分工作:

  • 直觉先于形式——先给画面,再给公式。「梯度下降是在雾中下山」比方程更先落地,然后方程才有处可附着。
  • 类比——把新想法连到他们已经知道的东西上。整个知识板块都建立在这之上:一张模型卡、一片有雾的山坡、桌面 上的一道影子。
  • 「讲回来」测试——理解的真正检验不是他们点不点头;而是他们能否用自己的话把它 讲给听。如果讲不出,缺口正好就在他们的讲解断掉之处。

04

带教者的策略手册

几条吃过苦头才学到的、能让一次辅导奏效的原则:

  • 在他们所在之处与他们相会——对准他们的实际水平,而非你希望他们所在的水平。 讲得太高,会让他们掉队;讲得太低,会让他们无聊。
  • 有益的挣扎——别把答案直接递过去。学习发生在搏斗之中,所以用问题引导,让他们 自己抵达。感觉最慷慨的帮助(直接告诉他们)教得最少。
  • 调试思维,而非代码——当某处坏了,错误通常在心智模型里,而非语法里。修好误解, 代码自会修好;只修代码,误解下周还会回来。
尝试卡住引导性提问理解→ 准备好独自面对下一个
带教的循环。学习者尝试、卡住,而带教者的工作是问出那个能疏通其思维的问题——而非把答案递过去——好让他们自己抵达,并能在下一次再做一遍。

05

真实、杂乱的数据

教科书用干净的数据集教学;世界递给你的是一团乱。一个带教者能做的最有价值的事情之一,是 尽早把学习者从整洁的玩具问题挪到真实、杂乱的数据上——因为真正的技能就活在那里。 与缺失值、古怪的格式、含糊的问题搏斗,教会的是任何干净教程都教不了的:大部分工作就是数据,而判断力比 背下来的步骤更要紧。

它也建立起与「卡住」之间正确的关系。在真实数据上,人人时时刻刻都卡着;把这件事正常化—— 「这就是工作本身,不是你失败的迹象」——便是让一个学习者坚持下去的一半。

06

教学让学习更深

这个现象有个名字——门徒效应:当你为教某材料、并把它讲给别人而做准备时,你会 学得更深。教学逼着你整理自己的知识、找出缺口,并构建那种只有你真正理解后才存在的干净 解释。我从带教数据科学中学到的,比坐在某些课堂里学到的还多。

坦白说,这正是这个知识板块存在的全部理由。从零写每一页,是规模化的教学——而不得不把嵌入、 自助法、或 CAP 定理讲清楚这件事本身,正是让我自己的理解保持锋利的东西。这个板块就是门徒效应,施加于我自己。

07

没人考的技能

带教让一样课程从不评分的东西浮出水面:在真实的数据科学里,沟通与判断力与数学同等 要紧。初学者系统性地低估这一点——他们以为工作是算法,而工作其实是框定正确的问题、 与人协作、并把结果讲清楚以让它被用起来(沟通页)。我能为一个学员做的最好的事,是拓宽他们对「技能」的定义,把没有考试衡量的那些 部分也纳进来。

08

通往我工作的贯穿线

09

60 秒回顾

反映了当前关于讲授数据科学与统计的文章(数据科学教育类文章、学徒/带教模型),以及亲身的 带教经验。