32

7篇重要的数据科学论文

 5 years ago
source link: http://shujuren.org/article/655.html?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

这是回到学校的时间,这里有一些论文让你在这个学年忙碌。 所有论文都是免费的。 这份清单远非详尽无遗,但这些是数据科学和大数据方面的一些重要论文。

谷歌搜索

  • PageRank - 这篇论文解释了Google搜索背后的算法。

Hadoop

  • MapReduce - 本论文介绍了处理大数据及的编程模型。 特别是,它是hadoop中使用的编程模型。

  • Google File System - hadoop的一部分是HDFS。 HDFS是论文中解释的分布式文件系统的开源版本。

NoSQL

这些是推动/开始NoSQL的两篇论文。 每篇论文都描述了一种旨在大规模扩展的不同类型的存储系统。

机器学习

Bonus Paper

  • 随机森林 - 最流行的机器学习技术之一。 它在Kaggle比赛中被大量使用,即使是获胜者也是如此。

你觉得还有其他任何文件应该列在名单上吗?

原文链接: http://101.datascience.community/2013/08/26/7-important-data-science-papers/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK