111

ML 工程师需要了解的一些基本算法

 6 years ago
source link: https://zhuanlan.zhihu.com/p/31530372?
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

ML 工程师需要了解的一些基本算法

一个相信理想主义的现实主义者
简评:机器学习的算法繁多,其中很多算法是一类算法,而有些算法又是从其他算法中衍生出来的,本文从算法类似性简单地列举一些常见的算法。

回归算法 Regression Algorithms

回归算法最初来自于统计学,是一种通过最小化预测值与实际结果值之间的差距,而得到输入特征之间的最佳组合方式的一类算法。

常见的回归算法有:

  • 最小二乘回归
  • Logistic 回归

拓展:Coursera Course by Johns Hopkins


聚类算法 Clustering Algorithms

聚类的本质就是寻找联系紧密的事物,把他们区分出来。聚类算法做的事情是,把输入样本聚成围绕一些中心的数据点,以发现数据分布结构的一些规律。

常见的聚类算法有:

  • K-均值聚类
  • 图团体检测

拓展:Amazing introductory video on clustering


降维算法 Dimensionality reduction algorithms

降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维算法能够去除冗余信息以及噪音信息,用更少的信息总结和描述出原始信息的大部分内容。

常见的降维算法:

  • 主成分分析算法
  • 低方差滤波
  • 高相关滤波
  • 反向特征消除 / 前向特征构造

拓展:KDnuggets blog


决策树算法 Decision tree algorithms

决策树算法在机器学习中算是很经典的了,决策树会根据数据中的值来创建决策模型,预测阶段选择路径进行决策。与其他算法不同的一点是,它们很容易在许多不同的数据类型上使用。

常见的决策树算法:

  • 分类及回归树(CART)
  • C4.5 and C5.0
  • Chi-squared Automatic Interaction Detection (CHAID)

拓展:Analytics Vidhya,本文是关于决策树较为深入的文章


深度学习 Deep Learning

深度学习近期在国内引起很大关注,它是一种半监督式学习算法,用来处理存在少量未标识数据的大数据集。利用摩尔定律带来的日益价廉的计算能力,深度学习得以建立大得多也复杂得多的神经网络。大众最熟知的例子就是围棋 AI —— Alpha Go

常见的深度学习算法:

  • 堆栈式自动编码器(Stacked Auto-encoders)
  • 卷积神经网络(Convolution Neural Network)
  • 递归神经网络(Recurrent neural networks)
  • 胶囊网络(Capsule Networks

拓展:这本书的片段 覆盖了深度学习的主要架构。

原文链接:

Essential Algorithms Every ML Engineer Needs to Know

分类收藏:

产品 | 设计 | 技术 | HackLife | Photography

推荐阅读:

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK