机器学习11-2--怎样用机器学习ML解决问题和在线学习
文章目录
机器学习11-2—怎样用机器学习ML解决问题和在线学习
本章讲了,通过误差、偏差和优化算法来进行算法的调试。并讲了一些调试的方法。然后,进行了误差分析,去掉一些不必要的特征。最后举例说明。
算法的调试(Debugging Learning Algorithms)
存在的问题
1、对于贝叶斯逻辑回归问题:
2、如果,误差太大,我们怎样做?
3、很显然,这样很耗时。
改进方法1:方差variance和偏差bias分析
改进方法2:优化算法和参数
参数是否恰当
算法是否收敛;是否正确优化了函数。
优化算法:通过对比两种算法
改进方法3:直觉
总结
出现的问题,及其解决方法:
误差分析和销蚀分析( Error analyses and ablative analysis)
误差分析
通过加入新的成分使得准确率逐步升高:
销蚀分析
逐一去除某一成分,分析那一个去除时,准确率下降最快。
总结
- Error analysis tries to explain the difference between current performance and perfect performance.
- Ablative analysis tries to explain the difference between some baseline (much poorer) performance and current performance.
实例问题分析(Getting started on a learning problem)
要解决一个问题,下面列出了两种方法。我们一般采用方法2(Approach #2)。因为,此方法可以快速实现我们的要求。此方法看似简单,但是NG说,很多人没有按照步骤做,结果导致半年甚至一年时间白白浪费掉。
总结
在线学习(online learning)
这一节相对比较独立,我就放在这里吧。
- 以前我们的学习算法:批学习算法(batch learning);这里为:在线学习(online learning)。
- 简而言之,每增加一个样本 都要重新计算一次$\theta$ 。即:
eg:我们举一个简单的例子,在逻辑回归中