43

机器学习训练秘籍:第10章

 5 years ago
source link: https://mp.weixin.qq.com/s/a3nJ8WzjYGID1fw42touew
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

机器学习训练秘籍:第10章

Original deeplearning.ai 吴恩达deeplearningai 2018-05-07

10 通过开发集和度量指标加速迭代

我们很难事先就知道哪种方法最适合解决面临的新问题,即使是一个经验丰富的机器学习研究员,他通常也需要在发现令人满意的方案前尝试不同的想法。在建立一个机器学习系统时,我往往会这样:

  1. 尝试一些关于系统构建的想法(idea)

  2. 使用代码(code)实现想法。

  3. 根据实验(experiment)结果判断想法是否行得通。(第一个想到的点子一般都行不通!)在此基础上学习总结,从而产生新的想法,并保持这一迭代过程。

    640?wx_fmt=jpeg

上图展示的是前面所提到的迭代过程,循环得越快,你也将进展得越快。此时拥有开发集、测试集和度量指标的重要性便得以体现了:每当你有了一个新想法,在开发集上评估其性能可以帮你判断当前的方向是否正确。

假如你没有一个特定的开发集和度量指标,则需要在每次开发新的分类器时把它整合到 app 中,并且体验几个小时来了解分类器的性能是否有所改进。这相当耗费时间!另外,如果你的团队将分类器的准确率从 95.0% 提高到 95.1%,这 0.1% 的提升可能很难被检测出来。但是积少成多,通过不断积累这 0.1% 的改进,你的系统将取得很大的改进。拥有开发集和度量指标,可以使你更快地检测出哪些想法给系统带来了小(或大)的提升 ,从而快速确定要继续研究或者是要放弃的方向。
敬请期待第11章:何时修改开发集、测试集和度量指标机器学习训练秘籍已发布章节第1-4章第5章第6章第7章第8章第9章英文版最新章节请在这里注册http://www.mlyearning.org/
为了让大家尽快接触到机器学习训练秘籍中文版,我们在最短的时间内组织了翻译工作。若有任何错误,还请包涵。翻译内容仍在持续改进中,如果大家有任何意见和建议,欢迎给我们留言。
欢迎扫码关注我们的公众号!谢谢!

640?wx_fmt=jpeg

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK