天道无常,顺其自然。
今日记录
周六,首经贸机器学习课(周振坤老师),第4章训练模型 + 第5章支持向量机。
返家途中,距离家200米的路口,北京突降冰雹,淋成落汤鸡。
读到的一段话
李继刚《人人都在盲人摸象》(2024.2.23):
在盲人摸象的故事中,人们嘲笑摸象的盲人认知之片面,是因为人们有眼睛,可以看到大象的全貌。但在老子看来,人人皆是盲人。谁也没有可以看到大道全貌的眼睛,我们都是瞎子。
核心观点:所有认知都是局部的,没人能看到全貌,所以应该保持谦卑。别人基于另一个视角的不同认知,不是要胜过的对手,而是补全视角的道友。
机器学习与盲人摸象的呼应
George Box 说过:"所有模型都是错的,但有些模型是有用的。"
这和"道可道,非常道"是一个意思——真实规律一旦被你用某个模型写出来,它就已经不是完整的真实规律了。
机器学习本身就是盲人摸象:
- 线性回归假设世界是直线的——摸到了象腿
- 多项式回归假设世界是曲线的——摸到了象鼻
- SVM假设世界可以用最宽的街道分开——摸到了象牙
- 每个模型都是特定假设下的局部最优,R²永远不可能等于1
不同模型不是"谁对谁错",而是从不同角度逼近真实。集成学习的思路恰恰就是"让多个盲人一起摸,综合判断"。
冰雹的启示
紧赶慢赶还是被淋。如果早知道,不如在学校多呆一会儿,可能就等到雨停了。
但"早知道"本身就是用未来数据做的回测——做决策的那一刻,手里只有当下的信息。
这和机器学习是一回事:
- "快走就能躲过雨"是一个预测模型
- 天气系统噪声太大,这个模型的R²约等于0
- 有些变量你控制不了,接受结果就好
顺其自然不是躺平,是承认:局部认知做出的决策,未必能拟合全部现实。接受噪声的存在,继续走。
今日课堂核心收获
第4章:训练模型
| 概念 | 一句话记忆 |
|---|---|
| 梯度下降 | 蒙眼下山,感受坡度,一步步走到谷底 |
| 学习率 | 步子太大跨过头,太小走不到 |
| 正规方程 | 直接公式求解,数据大了慢 |
| 学习曲线 | 模型的体检报告,一画就知欠拟合还是过拟合 |
| 正则化 | 给参数加紧箍咒,防过拟合 |
| 逻辑回归 | 线性回归 + Sigmoid = 分类器 |
第5章:支持向量机
| 概念 | 一句话记忆 |
|---|---|
| SVM | 不只分开,还要分得"街道最宽" |
| 支持向量 | 压在街道边缘的几个关键点,决定一切 |
| 软间隔/C | 允许多少点越界,C大严格C小宽松 |
| 核技巧 | 不真升维就能处理非线性,SVM的灵魂 |
一句话总结今天
人人都在盲人摸象,模型都在局部逼近,冰雹不会等你到家。接受不完美,继续走。