
3

搜/广/推/NLP/CV/数据挖掘怎么选
source link: https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ%3D%3D&%3Bmid=2650429788&%3Bidx=3&%3Bsn=637a2deb07263f32d9b4d0382fcf27c5
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

搜/广/推/NLP/CV/数据挖掘怎么选
很多同学向困哥咨询,开发岗和算法岗到底怎么选?算法岗中又怎么选择适合自己的研究方向和就业方向?前者我之前已经有过回答,看这里;后者今天整理一份不同算法岗的介绍和个人建议供大家参考:
- CV:CV是计算机视觉,作为算法岗火爆先锋部队,在五年前吃到了一大波红利。算法岗的落地场景我认为在搜索、广告、推荐、自然语言处理、计算机视觉、数据挖掘这六大算法岗中最多的。比如所有人都知道的人脸识别就是其中最大的应用场景,并且已经完全落地了,应用在无人售货机支付、APP登陆、支付宝微信银行等实名验证、交通违法自动识别、罪犯跟踪、门禁等等等等,商汤几乎就是靠着一手人脸识别的产品养活了整个公司。除此之外,CV还有无人驾驶、智能家居、监控、视频内容理解等等场景。但是应用场景多+第一批深度学习红利,带来的结果就是“卷”,七八年前,大量的计算机从业者转行深度学习、人工智能,所以导致人才溢出,供大于求。现在的情况就是,「没有顶会、比赛或者非名校根本进不了大厂」。这并不是一个危言耸听的事实,但是大家也不必过于焦虑,从我身边的例子来看,顶会or比赛or名校,有其一,在基础水平扎实的情况下,就能进大厂,具体怎么准备才能进,我之后会说。但也正是由于CV大大超过其他算法岗的落地场景,在算法岗普遍卷的今天,我反而推荐「以SSP为目标的,还有2年及以上多学校时间」的同学们去学习CV,因为现在“卷”不代表以后也“卷”。因为CV前几年卷,所以这几年大家大有着一起涌入搜广推的趋势,CV反而没想象中的卷。我身边就有不少非科班的同学去了大厂的CV岗(PS:他们有实习、名校、竞赛的背景其一)。当然,如果你马上就要准备春招了,手头只有CV的相关项目(相信大部分同学都是这个状态),那在学校还可以的情况下,冲一冲CV岗的实习也不是不可以,春招可比秋招简单多了,一段CV项目+不错的学校或者不错的比赛,足以进入任何一家大厂了,当然要是目标核心部门那要求还要更高一点。「总结:我认为CV的未来是光明的,人才需求是最多的,核心依据是它海量的应用场景,以及人才的流向分布,所以,如果你是刚进实验室的小白,想学CV又不敢学,大胆的去学,竞争比你想象的小;如果你是没有论文,但是名校毕业或手握项目和竞赛,面临春招不知道要不要找CV岗的应届生,大胆去找,竞争比你想象的小。」
- NLP:NLP是以上6个算法岗中最有挑战性的岗位,因为在CV中,视频可以分割为一帧一帧的图像,图像又可以分割为一个一个的像素点,像素点又是有限的,这很适合计算机去解析。但是文字不一样,且不说全世界有上百种文字,每种文字又有亿万种变换,更别说中文这种博大精深的语言了。就目前来看,NLP成功落地的场景也只有机器翻译了(搜索我们在下文再提),所谓的对话、问答等还远远没有达到实际应用的地步,跟CV的落地比起来差远了。所以说实话,「短期内我看不到NLP的前景,大多都是实验室的玩具,发paper的工具罢了」。而在企业中,NLP也没有太多的应用场景,大部分都是解析文本来给下游任务做特征的。从我的经历来看,比如爱奇艺这类视频APP做NLP的有一部分是解析弹幕、评论等给用户画像做特征;腾讯广告中的NLP有一部分就是解析文本,给广告的推荐做特征、给用户打标签等等;百度小度中的NLP是跟语音、搜索挂钩的;京东的NLP有一部分是做推荐理由的。所以,纯的NLP岗位是真的不多,但做研究另当别论,如果你是博士励志进入大厂的研究所,那么NLP绝对是一篇蓝海,还有很多方向值得去探索。但是如果你是去业务部门干活的,那NLP的坑位确实不多。「总结:我认为NLP是有极大挑战的,适合做研究的,因为很多问题都没解决;不适合做业务的,因为坑位少」
- 数据挖掘:与NLP关联比较大的岗位是数据挖掘,但是很多公司其实不区分数据挖掘和NLP。在腾讯,知识图谱就归于数据挖掘方向。数据挖掘是最原始的算法岗,其初始的含义是从数据中挖掘信息的岗位。由于深度学习的崛起,数据挖掘慢慢的就被数据分析、NLP等等岗位所替代。所以其实这个岗位大家不用单独的去关注和学习,数据挖掘算法和机器学习算法大部分是重合的,只有小部分是数据挖掘所独有的,比如Apriori等等。同理,在公司中,数据挖掘也更多的是和业务绑定的岗位,不用特意去准备或者投递。如果某个公司真的有数据挖掘、机器学习、推荐算法,三个不同的岗位,建议仔细看招聘JD,当然JD主要看什么呢?看部门,和负责的产品,这才是真实的,其他的都是假的。「总结:不用单独考虑这个岗位」
- 搜索:搜索算法也是和NLP密切相关的一个算法岗位,很多我认识的做NLP的同学都转向搜索算法了。现在搜索算法的需求很大,任何APP都有搜索的需求,但同样也很卷。大家想想,每个APP搜索的入口也就一两个吧,也就一两个团队在做,跟你竞争的都是NLP的大佬,什么研究对话的、研究问答的、研究翻译的,论文一套一套的,怎么打得过他们?「总结:如果你是NLP出身,又担心NLP坑位不好找的,就去做搜索」
- 推荐:推荐算法前几年是最容易就业的,因为推荐是直接跟钱挂钩的,最接近公司营收的环节,岗位相对比较多。更重要的是在CV之后,深度学习的一波红利也被推荐吃到了,大量的业务靠着深度学习的推荐指标起飞了一把,比如抖音和淘宝。但是推荐现在也面临一些问题,「一是政策,这个大家可以自行去了解一下;二是大公司的推荐很多都做到头了,很难有新的东西出来,指标很难提升,工程师的压力都很大;三是推荐这个岗位是和互联网的发展直接挂钩的,在增量时代推荐的人才当然是越多越好,但现在已经是存量了,互联网的发展慢慢陷入了瓶颈,推荐的日子也不好过」。我对推荐的未来持悲观态度,如果你是正在寻找方向的学生,那我是不推荐这个领域的,因为等你找工作了必然是2年之后的事情了,那时候互联网是什么情况真的不好说。对于今年春招的同学来说,你还是可以来吃一波最后的红利的,推荐,无论如何,在两年内,都会是最好找工作的算法岗之一,另一个是广告。另外,推荐门槛也低,基本有一段大厂实习+不差的学校就能通吃所有公司了(非核心部门)。「总结:如果你不着急就业,别学推荐,因为推荐发展一般;如果你急着找工作,那仍然可以来尝试一下」
- 广告:每每当人们提到推荐的时候,必然绕不开广告,这两者的技术栈很像很像很像。相信也有很多同学在犹豫投推荐好呢还是投广告好。在我当初纠结的时候,有一个前辈曾经告诉我,应届生首选广告,因为广告目标简单,无非点击和转化,比较纯粹,不像推荐要优化点击次日留存下拉概率浏览深度停留时长等等一系列指标。也正是如此,在广告中模型做的更深入,不用去考虑其他有的没的的东西,但也正是如此,广告的模型更卷,挠破头改模型,做无可做。前辈说的话,我不置可否,但是毋庸置疑的是,广告的场景比推荐更广,因为互联网公司就是靠广告赚钱的,每个公司都有广告团队,而且还不小,而且还很核心。可以说,你能进大厂广告部门,基本跳槽不愁了。但是有利就有弊,靠近盈利中心,就意味着压力大,能提指标固然能步步高升,不能提指标,那就很痛苦了。「总结:广告坑位多,部门核心,优先级高于推荐,但是卷、累、压力大」
说了那么多,最后做个总结吧,「看好CV的业务发展,看好NLP的研究发展;至于搜广推,如果你还不知道怎么选,那么建议看公司选职位,比如百度一定是搜索>广告和推荐,腾讯一定是广告>搜索和推荐,小红书一定是推荐>广告和搜索」,当然再细一点也可以看部门,这里就不再多做举例。
AINLP
一个有趣有AI的自然语言处理公众号:关注AI、NLP、机器学习、推荐系统、计算广告等相关技术。公众号可直接对话双语聊天机器人,尝试自动对联、作诗机、藏头诗生成器,调戏夸夸机器人、彩虹屁生成器,使用中英翻译,查询相似词,测试NLP相关工具包。
343篇原创内容
Official Account
进技术交流群请添加AINLP小助手微信(id: ainlper)
请备注具体方向+所用到的相关技术点
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
阅读至此了,分享、点赞、在看三选一吧?
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK