/knowledge/data-science-mentoring
数据科学带教
我在教它的过程中所学到的。本板块的每一页都是一个我得先讲给别人听的主题——而讲解它,正是我真正理解它之处。
- 学于
- 数据科学带教讲授 · 墨尔本大学同伴带教 2024
- 时间
- 墨尔本大学 · 澳国立 · 2024
- 应用于
- 教学是贯穿线
- 阅读 / 复习
- 约 12 分钟阅读2026-06-25
本板块的其他每一页,都是从一个学过该主题的人的座位上写的。这一页是从另一个座位上 写的——那个你得让别人理解它的座位。我通过墨尔本大学的同伴带教项目和澳国立的 Analytics Plus 项目带教数据科学的学生,而这改变了我看待整个领域的方式。
教学最大的意外,是它教会你多少。你无法解释你只懂一半的东西——你自己知识里的缺口, 会在一个学生问「可是为什么?」的那一刻浮现。这一页是本板块其余部分的反思性对应物:不是一个 我学过的主题,而是「学着去教这些主题」教会了我的东西。
01
从书桌的另一边
带教数据科学不同于辅导单一科目,因为这个领域太广,而学习者来自四面八方——怕代码的数学 人、怕统计的程序员、对两者都陌生的领域专家。这份工作不是灌输事实;而是帮一个人建起一个 他们能自行扩展的心智模型。一个好的带教者,会把自己做到失业。
这重新框定了下面的一切。一次辅导的目标不是回答你面前的那个问题——而是让学生在没有你的 情况下,对下一个问题更有能力一点。独立,而非依赖,才是衡量标准。
02
学习者在哪里卡住
辅导得足够多之后,你会一次次看到同样的墙,而它们几乎没有一个是关于智力的:
- 数学焦虑之墙——一个深信自己「不是数学的料」的学习者,在一个公式前僵住,而 那公式若先用文字拆解开来,他们本是能懂的。这道阻碍,在成为技术性之前,先是情绪性的。
- 工具执念——纠结于用哪个库、哪个模型,而不去问他们究竟想回答什么问题。他们 要的是先「怎么做」、后「做什么」,这是反的(问题 优先的教训)。
- 照着教程走却不理解——他们能把一个笔记本从头跑到尾、感觉很有成效,但改动一处 它就垮了,因为他们跟着的是步骤,而非抓住了那些步骤为什么奏效。
认出某人撞的是哪道墙,比懂材料更要紧,因为应对方式完全不同。数学焦虑的学习者需要安抚与 直觉;工具执念的学习者需要被拉回到问题上;照教程走的人需要被要求在运行之前先预测。
03
把难的东西讲简单
带教的核心手艺,是把难的东西讲简单、又不讲错。几个技巧承担了大部分工作:
04
带教者的策略手册
几条吃过苦头才学到的、能让一次辅导奏效的原则:
- 在他们所在之处与他们相会——对准他们的实际水平,而非你希望他们所在的水平。 讲得太高,会让他们掉队;讲得太低,会让他们无聊。
- 有益的挣扎——别把答案直接递过去。学习发生在搏斗之中,所以用问题引导,让他们 自己抵达。感觉最慷慨的帮助(直接告诉他们)教得最少。
- 调试思维,而非代码——当某处坏了,错误通常在心智模型里,而非语法里。修好误解, 代码自会修好;只修代码,误解下周还会回来。
05
真实、杂乱的数据
教科书用干净的数据集教学;世界递给你的是一团乱。一个带教者能做的最有价值的事情之一,是 尽早把学习者从整洁的玩具问题挪到真实、杂乱的数据上——因为真正的技能就活在那里。 与缺失值、古怪的格式、含糊的问题搏斗,教会的是任何干净教程都教不了的:大部分工作就是数据,而判断力比 背下来的步骤更要紧。
它也建立起与「卡住」之间正确的关系。在真实数据上,人人时时刻刻都卡着;把这件事正常化—— 「这就是工作本身,不是你失败的迹象」——便是让一个学习者坚持下去的一半。
06
教学让学习更深
这个现象有个名字——门徒效应:当你为教某材料、并把它讲给别人而做准备时,你会 学得更深。教学逼着你整理自己的知识、找出缺口,并构建那种只有你真正理解后才存在的干净 解释。我从带教数据科学中学到的,比坐在某些课堂里学到的还多。
坦白说,这正是这个知识板块存在的全部理由。从零写每一页,是规模化的教学——而不得不把嵌入、 自助法、或 CAP 定理讲清楚这件事本身,正是让我自己的理解保持锋利的东西。这个板块就是门徒效应,施加于我自己。
07
没人考的技能
带教让一样课程从不评分的东西浮出水面:在真实的数据科学里,沟通与判断力与数学同等 要紧。初学者系统性地低估这一点——他们以为工作是算法,而工作其实是框定正确的问题、 与人协作、并把结果讲清楚以让它被用起来(沟通页)。我能为一个学员做的最好的事,是拓宽他们对「技能」的定义,把没有考试衡量的那些 部分也纳进来。
08
通往我工作的贯穿线
09
60 秒回顾
反映了当前关于讲授数据科学与统计的文章(数据科学教育类文章、学徒/带教模型),以及亲身的 带教经验。