7

微软Excel还可以入门机器学习? 可别低估了这个上分利器

 3 years ago
source link: https://www.36kr.com/p/1063782337761672
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

编者按:本文来自微信公众号 “将门创投”(ID:thejiangmen) ,作者:VentureBeat;,编译: Shelly,36氪经授权发布。

不会编程?从微软的Excel开始机器学习之旅吧!对许多人来说,Microsoft Excel是一个电子表格应用程序,它以表格存储数据,执行非常基本的数学运算。但实际上,Excel不仅仅是计算工具,还能解决更强大更复杂的问题,用户可以直接在工作簿中创建机器学习模型。

近年来,快速发展的机器学习已经涵盖了生活中的众多领域。许多企业将机器学习算法整合到运营和生产中,从而蓬勃发展;也有一些公司因为低估了人工智能的作用,没有及时把握住发展机遇,而落后于对手。

当然,掌握机器学习并不是一个简单的过程,仅线性代数和微积分就可以过滤掉一大批人!再加上学习编程语言(如Python),熟练使用数据科学和机器学习库(如Numpy、Scikit-learn、TensorFlow和PyTorch),如果你还想做能集成的大规模机器学习系统,就还得学习云平台(如亚马逊aws、微软Azure和谷歌云)……

不少初学者一定已经在心里打退堂鼓了吧。

要想很好地理解数据科学和机器学习,确实需要一些算法方面的实际经验。幸运的是,在这方面,一个非常有价值的工具是Microsoft Excel,正因为它很常见,人们往往低估了它的大用处。

a2EjU3.jpg!mobile

对大多数人来说,Excel只是一个电子表格,它以表格存储数据,并执行基本的数学运算。但实际上,Excel的功能远不止这些,你甚至可以直接在工作簿中创建机器学习模型!

在机器学习上,虽然Excel不会取代Python,但它是一个学习AI基础知识和解决许多基本问题的好窗口,在掌握了它的使用技巧后,你甚至不需要编写一行代码就可以实现自己的目的。

使用Excel进行线性回归机器学习

线性回归是一种简单的机器学习算法,在分析数据和预测结果方面有许多用途。当数据以表格形式整齐排列时,线性回归就特别能打了。用户可以直接用Excel电子表格创建回归模型。

其中最直观的是数据图表工具,它有强大的数据可视化功能,比如说,将散点图中的数据显示到直角坐标系中。除了显示数据分布之外,Excel图表还可以创建机器学习模型来预测数据值的变化,这就是趋势线(Trendline)功能。用户可以将趋势线设置为线性、多项式、对数和指数等回归算法,不仅可以配置图表来显示机器学习模型的参数,而且能使用该模型来预测新的观测结果。

添加多条趋势线还能快速测试和比较不同机器学习模型的性能。

bU3MRrZ.jpg!mobile

虽然这并非数据科学工作最有效的方式,但它绝对称得上是入门机器学习算法的一个非常好的途径。

Excel表格与其他机器学习算法

除了回归模型,用户还可以使用Excel学习其他机器学习算法,比如,监督与非监督机器学习算法,包括k均值聚类、最邻近方法、朴素贝叶斯分类和决策树。

这个过程有时可能会有点复杂,但如果坚持学习,逻辑就自然地连贯起来。譬如,在k均值聚类学习中,用户将会在多个工作表中大量使用Excel公式(INDEX、IF、AVERAGEIF、ADDRESS等)来计算聚类中心。这种数据分类的方法虽然不是很有效,但因为它们在每个表单中都得到了改进,所以便于跟踪和研究。

FJfMZzm.jpg!mobile

再比如说,在决策树/决策图表学习中,用户会学习计算熵和机器学习模型的分支选择特征。整个学习过程是手动的,所以会很缓慢,但这将成为日后学习机器学习算法的有益经验。

在Excel中,用户还可以使用求解工具(Solver)来最小化丢失函数。但这也暴露了Excel的局限性:即使是一个只带十几个参数的简单模型也会大大降低计算机的速度,尤其是当数据样本有几百行时,计算机运行速度的下降就更明显了。而微调模型参数的求解器正是非常庞大的工具,不得不说,这会有些麻烦。

Yr6fqaA.jpg!mobile

Excel的求解工具微调模型参数,并使损失函数最小化

使用Excel进行 深度学习和自然语言处理

Excel还可以表达更高级的机器学习算法。拿深度学习来说,首先,需要创建一个只有不到12个参数的单层人工神经网络;然后扩展概念,来创建一个隐藏层的深度学习模型。尽管计算缓慢而低效,但它是可以运行的,组件就是单元格值、公式和强大的求解器。

Rba2qia.png!mobile

微软Excel的深度学习帮助用户更好地理解深度神经网络的运作过程。

在自然语言处理这部分,使用Excel还可以创建情感分析机器学习模型。如果要处理某家酒店的住客点评数据,用户可以使用公式来创建一个“单词包”模型,预处理和标记酒店评论,并根据评论的正面影响和负面影响对它们分类。在这个过程中,用户会学到很多关于现代人工智能如何处理语言的方法,并且认识到它与人类处理书面和口头语言的方式有多么不同。

作为机器学习工具的Excel: 职场人的上分利器

无论你是在公司做C级决策,做人力资源,还是管理供应链和生产设施,如果你要与数据科学家和AI研究员一起工作,学习机器学习的基本知识就至关重要。同样,如果你是一个报道AI新闻的记者或一家AI公司的公关代表,也最好对机器学习有个一知半解。

也许Excel就能帮助你获得重要的知识,虽然它不适合处理大数据集和复杂的算法,但它可以帮助可视化和分析小批量数据,从快速的Excel挖掘中获得的结果可以为正确的决策提供见解!

ref:

https://venturebeat.com/2020/12/30/you-dont-code-do-machine-learning-straight-from-microsoft-excel/


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK