41

周末好福利:送你三本大数据热门好书

 5 years ago
source link: http://www.10tiao.com/html/167/201807/2650769107/1.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.


数据采集、数据分析、数据价值挖掘……数据在企业发展中的核心战略性作用已毋庸置疑,作为与时俱进、挺立于企业软实力发展第一线的ITer,怎能不擅长大数据?


小编携手@图灵社区,带上三本大数据领域极受欢迎的热门书籍,用实力凝练的干货内容、案例配合的理解阅读来帮助你更好地学习大数据!



《Spark快速大数据分析》

作者:Holden Karau,Andy Konwinski,

Patrick Wendell,Matei Zaharia

译者:王道远


  • Spark作者及核心成员作品,Spark社区贡献者执笔翻译;

  • Spark入门第一书。


本书全面介绍Spark核心概念和基本原理,注重Spark用法。教会读者用Python、Java以及Scala的简易API来快速操控大规模数据集,使用简短的代码实现复杂的并行作业,了解从简单的批处理作业到流处理以及机器学习等应用。


购书链接:https://item.jd.com/11782888.html


《Spark高级数据分析(第2版)》

作者:Sandy Ryza,Uri Laserson,

Sean Owen,Josh Wills
译者:龚少成 邱鑫


  • 知名数据公司Cloudera数据科学家联合执笔;

  • Spark大规模数据分析实战宝典;

  • 新版针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。


本书涵盖大规模数据分析中常用算法、数据集和设计模式。自第1版出版后一直位列亚马逊网站大数据分析类图书前茅。升级版在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。


新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱进的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。


购书链接:https://item.jd.com/12371964.html


《Python数据科学手册》

作者:Jake VanderPlas

译者:陶俊杰、陈小莉


  • 目前图灵最受读者欢迎的数据科学和数据处理好书;

  • 掌握用Scikit-Learn、NumPy等工具高效存储、处理和分析数据;

  • 大量示例+逐步讲解+举一反三,从计算环境配置到机器学习实战,切实解决工作痛点。


本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。


购书链接:https://item.jd.com/12293703.html



不知道大家在工作中,碰上过哪些数据处理方面的难题?欢迎在本文微信订阅号(dbaplus)评论区写下你曾经或正在经历的困难(最好附上解决方案),小编将从中选出评论点赞数最高的两位,以及评论最精彩的一位读者,送出本期推荐的大数据好书一本,截止时间:下周四(7月5日)中午12:00。

注:同一个月里,已获赠者将不可重复拿书。



2018 Gdevops全球敏捷运维峰会-北京站即将于9月21日盛大举办!本次峰会聚焦运维与数据库两大方向,涵盖AIOps演进、DevOps落地、数据库选型、SQL优化等众多干货议题,邀请一众业界大咖与大家开启一场量身定制的技术探索与交流。


扫描以下二维码,了解更多峰会详情及报名↓↓↓


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK