53

从后台开发转向AI,他默默做了三年数学题

 5 years ago
source link: http://www.10tiao.com/html/778/201806/2247491095/1.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

 
编辑 | Debra  

来源 | 经授权转载自MIGvoice

AI 前线导读:张红林,曾经是一名后台开发,现在是 MIG 大数据领域的高级工程师。很多同学对于转型做 AI 有着很大兴趣,但转型背后,到底需要多少付出呢?MIG 先声派第二季的舞台上,他与我们分享了从后台开发到 AI 大数据的转型经验,这些坚持和自律的故事,或许都源于真正的热爱。

更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)




大家好,今天我和大家分享从一个后台开发转向 AI 的过程中,会碰到多少坑、需要投入多少精力、有多少成功的可能性。

最开始我是一个后台的开发,我用这张图来概括后台开发的工作。


这是用一个 330 万乐高积木搭建的可以住人的房子。后台开发有点像这个工作,我们要把逻辑做得很精细,一旦某个模块搭错了,就可能会出事。我们需要不断追求自己的经验和技艺。

在这里我先讲讲我的业余兴趣。我的爱好就是喜欢做一些数学题目,这是我朋友圈的一道题目,一般都叫小学六年级的题。


我先做了一个用微积分来解的方法,做完了以后我觉得太麻烦了,可以用三角函数来做,而且从结果来看确实是跟角度有关的,于是我用三角函数做了一遍。我验证了一下这两个结果,是一致的。

为什么要说这题目呢?因为 AI 看似很新,其实是一个很古老的学科。这张图可以简单看一下 AI 从诞生一直到 2006 年深度学习热起来,大家才开始接触起来。我接触也比较晚,大概 13、14 年开始接触。


刚开始接触 AI 的时候会有这样的一些坑。第一个我把它叫做碎片化时间陷阱,大家一直以为碎片化可以学到很多东西,于是我也关注了一堆的AI 公众号,每天看一下公众号的文章,觉得自己学会了很多。

但是会有什么问题呢?可能一个月我看了很多遍 CNN,但我还是无法了解 AI 的知识体系,在我看来,碎片化的时间是很难真正完成一个转行学习的。

第二,我把它称之为“边干边学”的陷阱。原来我们做后台的时候很提倡边干边学,就是我有什么不会的问题,我直接去网上搜一下代码或者找一下让自己改一改就可以了,但是在 AI 时代就不一样了。


这里我贴了一个 BP 的算法,它背后是一个数学的原理,你是没有办法随便改。中间这个图可以看到很多是数学推导,这时候你会有一个错觉,好像做 AI 就是每天很高大上地去推导公式写代码。实际的情况是像最右边的图和中间的下面图,每天看到的就是一堆杂乱无章的数据,所以业界一般也把 AI 工程师叫做“炼丹师”,需要有药材,需要有丹方,需要有炼丹的炉。药材可能就是数据,丹方就是模型,炼丹炉就是我们常见的一些 AI 的框架。

因为经历了前面的两个陷阱,我觉得我还是需要系统化地去把 AI 背后的数学原理学下来,而且本身我对数学也很感兴趣,所以我花了一些时间来看数学。这是我其中一本书的草稿纸,这样的书我大概看了有七八本,草稿纸没有 1 米也有两尺。为了这些题,我大概有 3 年时间除了一部电视剧没有看过其他电视,每天固定时间做题。


学完了数学以后再去看 AI 的书籍就会比较简单,要不了多久你就会对 AI 的整体样貌有所了解。

当然,只看书还不够,我们还需要在业务上有一些真实的效果。所以当时我们也有一个机会在业务上做实验。当你看到自己从最早的做数学题,到把系统的数学知识应用到 AI,再把模型落地到业务中,整个关节打通后,还是很有成就感的。

但是到了这里好像我们发现这条路特别容易走到头。因为我们以前做后台,不太需要去想我们下一步做什么,有产品同学帮助我们去设计。但是在 AI 领域中,我们再要去提升效果再突破该怎么办?模型就这么多,数据翻来覆去处理,不断去挖特征,还是很难突破。

这个时候我建议大家可以看看《佛经》缓解一下心情,心存喜乐,即使做了很久没有什么效果也不要沮丧,有的时候突破就是在你想象不到的,或者你永远想不到的一个新方向。

没多久后我们又找到了新的突破点。我们把特征做大,提升到十亿、百亿级,做成大规模的拓展,为此,我们也专门开发了新的“炼丹炉”——无量系统。另外一个突破是什么?我们再来举个例子,这里大概有一两百行数学推导,落在代码上其实只用改一行,改完这一行以后可以把一个很成熟的优化代码再次往上推进一截。


到了最后反而是我们又回到了最开始。最开始我是做工程的,中间我做过一段时间算法,到后来我们发现其实工程和算法是没有明确的界限的,工程仍然很有价值。我们要想在业务上取得一些效果,需要工程和算法做一个联合的设计,这个很典型的问题就是把很大的模型推到线上去,这个过程中我们从算法的角度去做了优化,从工程上做了优化,最终保证它能够上线。

所以我们认为,当我们工程上碰到了困难,我们可以转向算法。当算法碰到了瓶颈,可以求助佛学。最后又从佛学回到工程。

最后总结一下。

第一,我们常说知行合一,当我们去转型时,到底是知为行之始,还是行为知之成呢?所以在我看来,当我们去做一个跨行的时候,可能是知为行知始,我们首先最难的是完成新行业的知识原始积累。这个过程是比较枯燥和痛苦的事情,当完成这个环节后,才适合去边看边学。

第二,兴趣是最好的导师。只有兴趣才能让你持之以恒。过上三年苦行僧一样的生活很难,如果你没有兴趣的话。

第三,思维全面升级。从工程到 AI 是一种思维的转换,这种转换可能是涉及各个岗位的。

今日荐文

点击下方图片即可阅读

重磅!微软内部研究数据集正式对外开放



课程推荐

《机器学习 40 讲》已经开始更新!副教授王天一为你讲解机器学习必备核心理论,深入剖析 30 个最流行的机器学习模型,更有基于 python 语言的实例练习,帮你打通机器学习的任督二脉。

【订阅福利】

福利一:新人注册领 30 元礼券

福利二:每邀请一位好友购买,你可获得 18 元现金返现,多邀多得,上不封顶,立即提现(提现流程:极客时间服务号 - 我的 - 现金奖励提现)

【订阅方法】识别下图二维码,微信支付,立即成功订阅。

「阅读原文」,订阅专栏


AI前线 紧跟前沿的AI技术社群

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK