46

资源 | 吴恩达《ML Yearning》52章译文,一份很有诚意的GitHub项目

 5 years ago
source link: http://www.10tiao.com/html/162/201807/2650745308/2.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

机器之心整理

作者:xiaqunfeng


近日,有开发者在 GitHub 上给出了吴恩达《Machine Learning Yearning》的非官方译文。作者 xiaqunfeng 表示这个项目是在边学边翻的过程中构建的,且目前已经完成了前面 52 章的翻译。这个项目主要在于提供学习交流,中间的表述或翻译也会有一些误差,读者可详细查阅译文并提供修正意见。


在该 GitHub 项目中,读者可直接下载各章节译文的 MarkDown 文档,也可以下载 PDF 版的英文原版。此外为了有更好的阅读体验,作者为这个项目构建了 GitBook,读者可直接在线阅读。


  • 原书官网:http://www.mlyearning.org/

  • 项目地址:https://github.com/xiaqunfeng/machine-learning-yearning

  • 书籍地址:https://xiaqunfeng.gitbooks.io/machine-learning-yearning/content/


这本书的目的是教你如何做组织一个机器学习项目所需的大量的决定。


你将学习:


  • 如何建立你的开发和测试集

  • 基本错误分析

  • 如何使用偏差和方差来决定该做什么

  • 学习曲线

  • 将学习算法与人类水平的表现进行比较

  • 调试推理算法

  • 什么时候应该和不应该使用端到端的深度学习

  • 按步进行错误分析


已翻译章节


第一章:为什么是机器学习策略

第二章:如何使用这本书来帮助你的团队

第三章:预备知识和注释

第四章:规模驱使机器学习前进


配置开发与测试集


第五章:您的开发和测试集

第六章:你的开发集和测试集应该来自相同的分布

第七章:开发集/测试集需要多大?

第八章:为你的团队进行算法优化建立一个单一数字的评估指标

第九章:优化指标和满足指标

第十章:有一个开发集和评估指标来加速迭代

第十一章:何时更改开发/测试集和评估指标

第十二章:小结:建立开发集和测试集


基本误差分析


第十三章:快速构建第一个系统,然后迭代

第十四章:错误分析:查看开发集样本来评估 idea

第十五章:在错误分析过程中并行评估多个想法

第十六章:清理贴错标签的开发和测试集样本

第十七章:如果你有一个大的开发集,将其分成两个子集,只着眼于其中的一个

第十八章:Eyeball 和 Blackbox 开发集应该多大?

第十九章:小贴士:基本错误分析


偏差和方差


第二十章:偏差和方差:错误的两大来源

第二十一章:偏差和方差的例子

第二十二章:比较最优错误率

第二十三章:处理偏差和方差

第二十四章:偏差和方差间的权衡

第二十五章:减少可避免偏差的方法

第二十六章:训练集上的错误分析

第二十七章:减少方差的方法


学习曲线


第二十八章:诊断偏差和方差:学习曲线

第二十九章:绘制训练错误曲线

第三十章:解读学习曲线:高偏差

第三十一章:解释学习曲线:其他情况

第三十二章:绘制学习曲线


对比人类水平性能


第三十三章:为什么我们要比较人类水平的表现

第三十四章:如何定义人类的表现

第三十五章:超越人类表现


在不同分布上训练和测试


第三十六章:何时应该在不同的分布下训练和测试

第三十七章:如何决定是否使用所有数据

第三十八章:如何决定是否包含不一致的数据

第三十九章:加权数据

第四十章:从训练集到开发集的泛化

第四十一章:识别偏差、方差和数据不匹配错误

第四十二章:处理数据不匹配

第四十三章:人工数据合成


调试推理算法


第四十四章:优化验证测试

第四十五章:优化验证测试的一般形式

第四十六章:强化学习案例


端到端深度学习


第四十七章:端到端学习的兴起

第四十八章:更多端到端学习示例

第四十九章:端到端学习的优点和缺点

第五十章:选择流水线组件:数据可用性

第五十一章:选择流水线组件:任务简单

第五十二章:直接学习丰富的输出


更新记录:


  • update 2018.04.25:NG 终于出 15~19 章的手稿啦,等的好辛苦(DONE)


Tips:在原先的 12 章和 13 章之间新增一个章节 13 Build your first system quickly, then iterate,原先的 chapter13 变为 14,chapter14 变为 15


  • update 2018.05.02:手稿 20~22 章已出(DONE)

  • update 2018.05.09:手稿 23~27 章已出(DONE)

  • update 2018.05.16:手稿 28~30 章已出(DONE)

  • update 2018.05.23:手稿 31~32 章已出(DONE)

  • update 2018.05.30:手稿 33~35 章已出(DONE)

  • update 2018.06.06:手稿 36~39 章已出(DONE)

  • update 2018.06.13:手稿 40~43 章已出(DONE)

  • update 2018.06.20:手稿 44~46 章已出(DONE)

  • update 2018.06.27:手稿 47~49 章已出(DONE)

  • update 2018.07.04:手稿 50~52 章已出(DONE)


业余时间翻译,水平有限,如有不妥或错误之处,欢迎不吝赐教。



本文为机器之心整理,转载请联系原作者获得授权

✄------------------------------------------------

加入机器之心(全职记者 / 实习生):[email protected]

投稿或寻求报道:content@jiqizhixin.com

广告 & 商务合作:[email protected]


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK