1

厉害了,这18张Python数据科学速查小抄

 3 years ago
source link: https://zhuanlan.zhihu.com/p/369621406
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

厉害了,这18张Python数据科学速查小抄

公号:Python大数据分析,关注进学习群

数据科学已经发展成为一个庞大的系统,包含数学、统计学、概率论、计算机、数据库、编程等各种理论技术。

目前在主流的数据科学领域一般有三大生态,一是以sas、matlab、spss等为代表的商业软件生态,二是围绕R语言建立起来的开源生态,三是目前较为火热的Python数据科学生态。

为什么Python会脱颖而出,成为数据科学的第三极,而且越来越受欢迎呢?

这是因为数据科学编程需要非常灵活的语言,编写代码很简单,但可以处理高度复杂的数学处理。

Python可以说最适合这样的需求,所以大量的数据科学库如春笋般冒出来,有的已经发展成高度完善的企业级库。

比如说Pandas、Numpy、Matplotlib、Sklearn、NLTK等,还有深度学习领域的Keras、Tensorflow、Pytorch、Caffe等,都是顶尖的数据科学工具。

Github上有一个项目,专门汇总了Python数据科学的核心知识点,并以速查表的形式,浓缩在一张张图片里。

Github地址:

https://github.com/FavioVazquez/ds-cheatsheets

这里面有Python语法基础、Pandas入门及进阶、可视化、机器学习、Jupyter、SQL、Spark等,十分适合用来检索速查。

如果Github比较慢,我下载好了高清图片版,大家可以去下载看

速查表清单:

Python基础

Pandas基础

Pandas进阶

Numpy基础

Matplotlib基础

Seaborn基础

Bokeh基础

Scipy基础

scikit-learn基础

keras基础

Jupyter基础

数据IO

SQL基础

Dask基础

Dask进阶

PySpark基础

PySpark进阶

可视化基础




About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK