

40万年薪的算法岗位,面试官到底问些什么?
source link: http://mp.weixin.qq.com/s?__biz=MzI1MTE2ODg4MA%3D%3D&%3Bmid=2650073494&%3Bidx=1&%3Bsn=5a9bcf3cda24c92e8eabcea456b413b8
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

2015年自从我担任当时算法组的小组leader,我作为面试官面试了不少同学。前前后后面试了超过 200 名同学,其中有不少入职的同学后来发展都不错,也坚定了自己对于选人的标准的自信心。
今年2020年找工作尤其艰难,我把这些年作为面试官一些重要的 面试题 整理出来,一共 80道 ,希望能够帮助到大家,为了方便大家,我做了一个归类,一共分成了6大类,分别是: 机器学习,特征工程,深度学习,NLP,CV,推荐系统。 这些知识既是面试中的常见问题,也可以作为大家整理自己思路的参考资料。
机器学习理论类:

1. 写出全概率公式&贝叶斯公式
2. 模型训练为什么要引入偏差(bias)和方差(variance)? 证
3. CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型
4. 如何解决过拟合问题?
5. One-hot的作用是什么?为什么不直接使用数字作为表示
6. 决策树和随机森林的区别是什么?
7. 朴素贝叶斯为什么“朴素naive”?
8. kmeans初始点除了随机选取之外的方法
9. LR明明是分类模型为什么叫回归
10. 梯度下降如何并行化
11. 梯度下降如何并行化
12. LR中的L1/L2正则项是啥
13. 简述决策树构建过程
14. 解释Gini系数
15. 决策树的优缺点
16. 出现估计概率值为 0 怎么处理
17. 随机森林的生成过程
18. 介绍一下Boosting的思想
19. gbdt的中的tree是什么tree?有什么特征
20. xgboost对比gbdt/boosting Tree有了哪些方向上的优化
21. 什么叫最优超平面
22. 什么是支持向量
23. SVM如何解决多分类问题
24. 核函数的作用是啥
特征工程类:

1. 怎么去除DataFrame里的缺失值?
2. 特征无量纲化的常见操作方法
3. 如何对类别变量进行独热编码?
4. 如何把“年龄”字段按照我们的阈值分段?
5. 如何根据变量相关性画出热力图?
6. 如何把分布修正为类正态分布?
7. 怎么简单使用PCA来划分数据且可视化呢?
8. 怎么简单使用LDA来划分数据且可视化呢?
深度学习类:

1. 你觉得batch-normalization过程是什么样的
2. 激活函数有什么用?常见的激活函数的区别是什么?
3. Softmax的原理是什么?有什么作用?
CNN的平移不变性是什么?如何实现的?
4. VGG,GoogleNet,ResNet等网络之间的区别是什么?
5. 残差网络为什么能解决梯度消失的问题
6. LSTM为什么能解决梯度消失/爆炸的问题
7. Attention对比RNN和CNN,分别有哪点你觉得的优势
8. 写出Attention的公式
9. Attention机制,里面的q,k,v分别代表什么
10. 为什么self-attention可以替代seq2seq
NLP类:

1. GolVe的损失函数
2. 为什么GolVe会用的相对比W2V少
3. 层次softmax流程
4. 负采样流程
5. 怎么衡量学到的embedding的好坏
6. 阐述CRF原理
7. 详述LDA原理
8. LDA中的主题矩阵如何计算
9. LDA和Word2Vec区别?LDA和Doc2Vec区别
10. Bert的双向体现在什么地方
11. Bert的是怎样预训练的
12. 在数据中随机选择 15% 的标记,其中80%被换位[mask],10%不变、10%随机替换其他单词,原因是什么
13. 为什么BERT有3个嵌入层,它们都是如何实现的
14. 手写一个multi-head attention
推荐系统类:

1. DNN与DeepFM之间的区别
2. 你在使用deepFM的时候是如何处理欠拟合和过拟合问题的
3. deepfm的embedding初始化有什么值得注意的地方吗
4. YoutubeNet 变长数据如何处理的
5. YouTubeNet如何避免百万量级的softmax问题的
6. 推荐系统有哪些常见的评测指标?
7. MLR的原理是什么?做了哪些优化?
计算机视觉(CV)类:

1. 常见的模型加速方法
2. 目标检测里如何有效解决常见的前景少背景多的问题
3. 目标检测里有什么情况是SSD、YOLOv3、Faster R-CNN等所不能解决的,假设网络拟合能力无限强
4. ROIPool和ROIAlign的区别
5. 介绍常见的梯度下降优化方法
6. Detection你觉的还有哪些可做的点
7. mini-Batch SGD相对于GD有什么优点
8. 人体姿态估计主流的两个做法是啥?简单介绍下
9. 卷积的实现原理以及如何快速高效实现局部weight sharing的卷积操作方式
10. CycleGAN的生成效果为啥一般都是位置不变纹理变化,为啥不能产生不同位置的生成效果
这些问题的答案, 我们给大家整理了一个资料包,大家扫码添即可领取,祝大家求职顺利~
长按扫码添加
本号只有 100个名额
:point_down::point_down::point_down:



备注 【面试题】 添加:point_up_2:
Recommend
-
70
点击上方蓝色字体,关注我们 腾讯两个月的实习一转眼就结束了,回想起当时面试的经过,感觉自己是跌跌撞撞就这么过了,多少有点侥幸。马上腾讯...
-
71
点击上方“ 程序人生 ”,选择“置顶公众号” 第一时间关注程序猿(媛)身边的故事 ...
-
41
想当初还在学校的时候,参加面试,往往表现紧张,事前会背常见问题的面经,反复想自我介绍怎么说,却摸不上头脑一些问题到底想听到什么答案。 现如今也算是做了 3 年多的面试官,初入职场已经是14年初时候的事了,后来到了腾讯,...
-
8
PHP+Golang冲击一线大厂年薪50万岗位招聘 PHPsix · 大约17小时之前 · 187 次点击 · 预计阅读时间 2...
-
8
论 AI 圈活菩萨,非李沐老师莫属。前有编写「动手学深度学习」,成就圈内入门经典,后又在B站免费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量36万,不少课题组从导师到见习本科生都在追番。如此给劲的分享,难怪不少人骄傲自称「已拜在老师...
-
5
【🐯初/中级前端面经】中小型公司面试时都会问些什么? 2022年02月15日 01:22 · 阅读 5125
-
9
我放弃了年薪 200 万的岗位,因为“复制粘贴”的技术活让人厌恶
-
7
我放弃了年薪 200 万的岗位,因为“复制粘贴”的技术活让人厌恶 2
-
4
找抖音主播带货合作话术问些什么?商家找达人带货话术 https://www.chenweiliang.com/cwl-28209.html
-
5
2023-06-19 06:03 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元 IT 之家今日发文称,随着 AI 产业的高速发展,科技行业对 AI 人才的需求也在水涨船高。据《USA Today》报道,面对巨大的人才缺口,越来越多的美国科技公司正试...
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK