75

《Hadoop Spark大数据巨量分析与机器学习整合开发实战》pdf电子书免费下载

 6 years ago
source link: https://www.linuxprobe.com/hadoop-spark-boork.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》从浅显易懂的“大数据和机器学习”原理介绍和说明入手,讲述大数据和机器学习的基本概念,如:分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用。为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单台Windows系统上通过Virtual Box虚拟机安装多台Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以将实践平台搭建在多台实体计算机上,以便更加接近于大数据和机器学习真实的运行环境。

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》**适合于学习大数据基础知识的初学者阅读,更适合正在学习大数据理论和技术的人员作为上机实践用的教材。

《Hadoop Spark大数据巨量分析与机器学习整合开发实战》电子书籍下载地址:

Linux就该这么学

您只需扫描右侧二维码或微信搜索:"LinuxProbe"即可完成下载

该页面的验证码:

请关注《Linux就该这么学》的微信公众号,回复:“验证码”,获取该页面的验证码。


Recommend

  • 77

    《区块链与大数据:打造智经济》提出了运用区块链技术解决大数据发展中所面临问题的思想。本书分为8章,首先通过对大数据发展所面临困境的分析,引出了迅速崛起的区块链技术,比较了两者的技术沿革及异同;然后通过分析数据流通中存在的问题,揭示了区块链技术...

  • 42

    《大数据治理与服务》一书从大数据治理的基本概念和现状出发,提出了大数据治理的框架及治理的关键要素,分析了大数据环境下企业面临的挑战、战略转型、组织职能分配,创新性地提出大数据架构,介绍了大数据环境下的数据质量、数据安全特点和应对方案,以及基于...

  • 61

    本书是一本Hadoop学习入门参考书 全书共11章 分为基础篇和提高篇两部分。基础篇包括靠前1~6章 具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章 具体包括协调系统Zookeeper、Hadoop数...

  • 258

    本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开...

  • 51

    本书系统介绍了大数据的相关知识 分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。 全书共15章 内容包含大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce...

  • 83

    《为数据而生:大数据创新实践 》在大数据概念如此流行的今天,为什么要读这本书?中国大数据领军人、大数据创新与实践一线专家、百万级畅销书《大数据时代》中文版译者周涛,耗时三年,将海量真实案例披沙拣金呈现给广大读者。在本书中,您将看到大数据在智慧交...

  • 109

    《Hadoop YARN权威指南》由YARN的创建和开发团队亲笔撰写,Altiscale的CEO作序鼎力推荐,是使用Hadoop YARN建立分布式、大数据应用的权威指南。书中利用多个实例,详细介绍Hadoop YARN的安装和管理,以帮助用户使用YARN进行应用开发,并在YARN上运行除了MapRedu...

  • 44

    《Python机器学习》机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类...

  • 91

    机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为。机器学习是人工智能的核心,是使计算机具有智能的根本途径。本书通过对机器学习的背景知识、算法流程、相关工具、实践...

  • 61

    本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开...

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK