32

零基础 SQL 数据库小白,从入门到精通的学习路线与书单

 4 years ago
source link: http://mp.weixin.qq.com/s?__biz=MzA5MTkxNTMzNg%3D%3D&%3Bmid=2650266455&%3Bidx=2&%3Bsn=515039feeccdb99bf56ec8a701003115
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

点击上方“ 涛哥聊Python ”,选择“星标”公众号

重磅干货,第一时间送达

来源: 有关SQL

a2U3I3Q.jpg!web

一,学SQL的苦恼

我观察了 865 个 SQL 入门者,发现大家在学习 SQL 的时候,最大的问题不是 SQL 语法,而是对 SQL 原理的不熟悉。

很多初学者,往往被 SQL 能做什么,为什么会有 SQL 这门语言给迷惑到了。他们用学英语的方法,去学SQL,结果发现什么都学不到,而且感觉越来越难学,难用。想想你为什么讨厌英语就明白了,每次翻开词典,从 abandon 学起来,不到 10 页就学不下去了,不就是因为太枯燥,太乏味了嘛。

假如我告诉你,听听音乐 yesterday once more, 看看电影 iron man 就能轻松学好英语,是不是觉得有趣多了?学 SQL 和学英语一样,选择枯燥的学习模式,必然带来不好的学习结果。我们追求的是轻松学 SQL 的方法。

二,SQL 的原理

SQL 的原理,超级简单,四个字,集合运算。

所有复杂的 SQL 语句,命令都是围绕着这个本质在做文章,添油加醋。

如果对集合这个概念陌生,没关系,高中毕业那么久,不记得情有可原。毕竟当时老师也不知道,风靡全球的 SQL 会基于集合理念发明出来。

集合,最简单的例子就是数组,比如 { a, b, c, d}。举个形象化的例子,比如大学全班同学,这是个大集合,按照性别进而可以分成男同学集合和女同学集合。

男同学有什么特征?高大,威猛,有胡子。

女同学有什么特征?白嫩,温柔,有长发。

就这样,我们有两个大集合了,男同学集合,女同学集合。回到 SQL 的原理上来,针对这两个集合,SQL 运算做的事情,无非就是这几样:

  1. 寻找身高大于180cm的男同学

  2. 寻找身高最高的男同学

  3. 寻找有胡子的男同学

  4. 寻找长了胡子,身高低于160cm的男同学

  5. 统计没有长胡子的男同学人数

  6. 寻找最高的女同学

  7. 寻找最白的女同学

  8. 寻找又高又白的女同学

  9. 寻找正在谈恋爱的男女同学

  10. 寻找曾经谈过恋爱,而现在又有其他男女朋友的男同学和女同学

你看,无非就是做这些事情。是不是对SQL立马就有好感了呢!

三,SQL 的数学基础

如此有趣的一件事情,教科书偏要说的枯燥(希望下面离散数学,集合理论的科普不会烦到你,不想看,完全可以跳过)

  1. 交换律(Commutative Laws):

    A ∪ B = B∪A, A ∩ B = B ∩ A

  2. 结合律(Associative Laws):

    (A ∪ B) ∪ C = A ∪ (B∪C) = A ∪ B∪C          

    (A ∩ B) ∩ C = A ∩ (B ∩ C) = A ∩ B ∩ C

  3. 分配律(Distributive Laws):

    (A ∩ B) ∪C = (A∪C) ∩ (B∪C)        

    (A∪B) ∩ C = (A ∩ C) ∪(B ∩ C)

  4. 等幂律(Impotent laws):

    A∪A = A,A∩A = A

  5. 吸收律(Absorption laws):

    (A∩B)∪A = A,(A∪B)∩A = A

  6. 同一律(Domination laws):

    A∪Ø = A,A∩Ω= A

    A∪Ω=Ω,A∩Ø = Ø;

参考:http://math001.com/laws_of_set_theory/

这罗列了详细的集合运算数学表达式。

所以,千万别被教科书上的数学符号吓到,而失去了学习SQL的兴趣。学霸别听我的,这些符号我知道对你完全是小菜一碟。

四,SQL基础问题

下面我们用SQL来回答上面的10个男女同学问题:

  1. 把全班男女同学登记到花名册上

  2. 找班上的八卦同学打听男女朋友关系,记录到恋爱关系秘本上

这里用到的花名册,恋爱关系秘本就是数据库里的二维表。先建这两张表,分别是 Students(花名册表),Relationships(恋爱关系秘本)。为了更加形象,用 Excel 展示下,这两张表分别长这个样子:

MvqYjeQ.png!web

第一张表是 Students 花名册表,共有 6 栏,分别解释下含义:

  • StudentId: 用来标注学生的学号,一个学生只有一个学号;

  • Name:学生姓名;

  • Gender:学生性别;

  • Height:学生身高,cm 为单位

  • Mustache:有无胡子;

  • SkinColor:肤色

第二张表是 Relationships(恋爱关系秘本),共有 6 栏,分别解释下:

  • RelationshipId: 男女朋友关系成立的编号,用来确立两人曾经处过或正在处于关系之中;

  • BoyId:男生编号;

  • GirlId:女生编号;

  • BeginDate:关系成立日期;

  • CurrentActive:当前是否还在恋爱期;Y 表示正在恋爱;N 表示已经分手;

  • EndDate:分手日期

注意: 栏位在数据库中被称为字段

用 SQL 语句来表达建表的命令:

Students:

Create Table dbo.Students(
    StudentId Varchar(10),
    Name Nvarchar(200),
    Gender Nvarchar(1),
    Height Numeric(4,1),
    Mustache Varchar(3),
    SkinColor Nvarchar(1)
);
Relationships:

Create Table  dbo.Relationships(
    RelationshipId Int,
    BoyId Varchar(10),
    GirlId Varchar(10),
    BeginDate Datetime,
    CurrentActive Varchar(1),
    EndDate Datetime
    );

注意:字段旁边必须加上数据类型,规范数据长度,精度,比如 varchar(3) 表示 3 个字长。

有关数据类型,可以参考参考官方文档对基本数据类型的定义和举例

五,在线运行SQL工具

推荐可在线执行SQL的工具: http://sqlfiddle.com/

这款工具,有两大特点:

  • 支持六大数据库,MySQL,Oracle,SQL Server,PostgreSQL,SQLite;

  • 支持在线编辑及执行SQL,无需自搭数据库环境

简单了解下:

BbaUza7.jpg!webimage

整个页面分为1,2,3个区域。

  1. 区域 1 的编辑器用来创建数据库 schema ,比如建表,新建数据;

  2. 区域 2 则用来编辑和执行 SQL;

  3. 区域 3 用来展示 区域 2 中的 SQL 执行结果

使用这款工具,无需你手工安装数据库便可以完成本指南所有的 SQL.

完美!我们成功的完成了第一步。

六,SQL 简易实战

接下来,让我们为巧妇准备好精米。

INSERT

使用这条 SQL 命令,将添加全班同学的个人信息,包括姓名,学号,性别,身高,肤色,有无胡子,以及男女朋友关系,(当然这可不能让班主任知道。)

INSERT INTO Students(
    StudentId,
    Name,
    Gender,
    Height,
    Mustache,
    SkinColor
)
    Values
    ('001',N'陈冠奇',N'男',186,'No',N'白'),
    ('002',N'谢堂风',N'男',182,'No',N'白'),
    ('003',N'黄博',N'男',176,'Yes',N'黑'),
    ('004',N'李少杰',N'男',172,'Yes',N'黑'),
    ('005',N'徐少斌',N'男',163,'No',N'黑'),
    ('006',N'张白芷',N'女',172,'No',N'白'),
    ('007',N'张少函',N'女',163,'No',N'白'),
    ('008',N'灵昆',N'女',181,'No',N'黑'),
    ('009',N'夏平',N'女',158,'No',N'白'),
    ('010',N'莫文丽',N'女',156,'No',N'白')
INSERT INTO Relationships(
    RelationshipId,
    BoyId,
    GirlId,
    BeginDate,
    CurrentActive,
    EndDate
)
    Values
    (1001,'001','006','2002-04-01','Y',null),
    (1002,'003','009','2001-04-01','Y',null),
    (1003,'005','010','2003-04-01','N','2004-04-01'),
    (1004,'002','010','2004-04-01','N','2004-05-01'),
    (1005,'004','010','2004-05-01','N','2005-08-01')

接下来我们用 SQL 做一些有意思的事情:

查找身高大于180cm的男同学:

SELECT Name
FROM Students 
WHERE Height > 180 and Gender = N'男'

查找身高大于170cm的肤白女同学:

SELECT Name 
FROM Students 
WHERE Height> 170 and SkinColor = N'白' and Gender = N'女'

查找最高的女同学:

SELECT Name
FROM Students 
WHERE Height = (SELECT MAX(Height) FROM Students WHERE Gender = N'女' ) 
and Gender = N'女'

查找有恋爱关系的同学:

SELECT Boy.Name as BoyName,
        Girl.Name AS GirlName
FROM Relationships Rel
    INNER JOIN Students Boy on Rel.BoyId = Boy.StudentId
    INNER JOIN Students Girl on Rel.GirlId = Girl.StudentId

最帅的陈冠奇居然留胡子了,让我们记录下:

UPDATE Students 
    SET Mustache = 'Yes'
WHERE Name = N'陈冠奇'

帅奇留胡子的原因居然是,陈冠奇和张白芷前两天分手了,我们要记录这段关系的破裂:

UPDATE Relationships
    SET CurrentActive = 'N',
        EndDate = '2008-04-01'
WHERE BoyId = (SELECT StudentId FROM Students WHERE Name = N'陈冠奇') AND 
    GirlId = (SELECT StudentId FROM Students WHERE Name = N'张白芷')

任何的痛苦都离不开恋人的离去,张白芷居然去国外留学了,因此花名册少了这个人:

DELETE Students 
WHERE Name = N'张白芷'

帅帅的陈冠奇,怎么甘心就此沉沦,他又找了莫文丽做女朋友:

INSERT INTO Relationships(
    RelationshipId,
    BoyId,
    GirlId,
    BeginDate,
    CurrentActive,
    EndDate
)
    Values
    (1006,'001','010','2008-04-01','Y',null)

好奇的小乐,查了查莫文丽的后台,发现她居然曾有过三次恋爱关系:

SELECT RelationshipId 
FROM Relationships 
WHERE GirlId = (SELECT StudentId FROM Students WHERE Name = N'莫文丽')

恭喜!到此为止,所有的SQL基本操作你都会了。

七,SQL 晋级分水岭

有竞争力的技术肯定是要花大功夫来磨炼的,否则人人看一遍就会的东西,卖得出什么高价呢!

因此当大家都度过第一阶段之后,如何意识到还有第二阶段,第三阶段,甚至第四阶段就很重要了。那会影响你的长期发展。舒适区是留给平庸者的。

从技术角度,我们习惯将 SQL 数据库开发分为 4 个阶段:入门,初级,高级,资深。

注:技术角度可分这四个阶段,并不代表做到资深,你一定能年薪百万。可千万别这么想,很多朋友咨询我的第一个问题是,“黄老师,以我的水平,能要个30K不?” 这我不打包票,能做到什么收入完全看你水平和天意(没错,很多时候,赚大钱靠运!)

在本文中,我只谈 SQL 技术水平的晋级,不谈其他。

上面的入门指南,相信你看完之后,写 SQL 基本掌握了。这一阶段过后,就是要通过反复的操练这些 SQL ,直到你熟透这些 SQL 命令和语法。

帮你度过这阶段最好的方式,是什么呢?刷题。没错,简单粗暴。这里推荐牛客网,你可以试着去刷:

2eyyUjZ.jpg!webimage

左边是题目,右边编辑 SQL, 点击【保存并调试】即可运行 SQL。系统会提示,你的答案是否通过!

刷完这 60 多道题目,相信你的感觉一定很好!

再推荐基本经典的小书,可以兼顾理论与实战,具体看哪一本,依据你使用的数据库软件来:

《SQL 必知必会》(综合)

《T-SQL Querying》中文《T-SQL 查询》(SQL Server适用)

《Oracle编程艺术》(Oracle适用,只要是 ASK Tom 主编 Thomas Kyte 的著作不会错)

八,SQL 数据库深入学习

当你跨过了第二个阶段,所有的 SQL 命令都会了,看到 SQL 题目也有自信了,自认为天下数据,为 SQL 皆可取的时候,你应该来挑战下高难度了

现在你的角色是河南郑州大学的学生会主席,所有学生的信息都归你管。别小看了这学生会主席,2017 年郑州大学在校人数总共有7.26万人。此时,你再查找个又白又高的女生,嘿嘿…别想歪咯,数据查询就会很难了。看你急不急!

怎么办呢,SQL 命令你也玩熟了,但每次查个人都要花费个20,30秒,查个交友记录,快则1,2分钟,慢则半天!

此时,你该修炼下 SQL 性能调优了。而 SQL 数据库开发真正的挑战才正式开始!

要研究数据,就要从体系着手,我总结了一下目前正在使用的 SQL Server,它的知识点可以用 20 张思维导图来表达。而 SQL 性能调优正是与这 20 个知识点息息相关。

这20个知识点可以在这篇文章中找到:

20 图归纳 SQL 数据库知识点

如果你使用的是其他数据库,那么一份详细的数据库体系图,是必不可少的。它就是深夜里的北极星,为你照亮了前进的方向。

当然你跟我一样,对纸质书情有独钟的话,这里推荐几本:

综合类的数据库调优书:

《数据库索引设计与优化》

《数据查询优化器的艺术》

Oracle 相关调优书:

《Oracle Concepts》

《Oracle 体系架构》

《Oracle DBA 手记》(云和恩墨出品都是精品)

MySQL 相关调优书:

《高性能 MySQL》

SQL Server 相关调优书:

《Inside SQL Server 》系列

《T-SQL 性能调优密集-基于 SQL Server 2012 窗口函数》

这些书看下来应该会耗掉你2-3年的时间。当然,如果你愿意痛饮咖啡,用007(一周工作7天,每天连续12个小时)的速度来看书,那也可能1年左右就够了。但不建议这么干,身体健康比什么都重要!

九,SQL 人的职业生涯

当任何超过5秒的SQL,在你手下都变成了秒出时,你可能会昂天长啸,“老子终于天下第一啦”。不过且慢,你别忘记了,你还是会被项目经理催着干活,比如改个字段,改个需求,改处bug等等。此时,你恐怕最需要的是,一个得力的左膀右臂,一个能打的需求分析,更重要的是搞定灵活多变的业务变更,甚至你要挽起袖子,自己盯着业务变更,发布更灵活适配的数据模型。此时数据建模,业务管理,数据治理,数据挖掘,安全审核等等都来了

此时,正是你职业生涯的分水岭。

若你觉得你就是干不了开会,扯皮,来回折腾的活儿,就喜欢指挥机器干活,那就选择偏技术的方向,比如运维DBA,数据库研发。从事这条路线,意味着你要懂的更多的边角料知识,比如操作系统,网络协议,自动化编程,架构设计,分布式计算,云计算等。这些知识资料早已有现成的资料可以参考,只要耐得下心来学,一定有成功出头的那一天。但也极其容易放弃,因为东西实在太多,太杂,而且有些边缘性的学科,一时半会你还用不到,比如网络协议。但如果不懂网络协议,碰到数据库安全的问题,你就容易败下阵来,死的很惨。你的任何一个缺点都会伴随每一次的故障而被无限放大,被很多同事视为毫无战斗力,让你自己都开始怀疑自己,鄙视自己。所以干这行,首先要有一颗强大的心脏,在无数的口诛笔伐之下,你要坚挺自己的信念,不要怀疑自己的判断,丢失基本判断能力。

且运维不仅仅是个智力活,还是个体力活。

白天所有运行在数据库上的应用都好好地跑着,一般不会有大问题,看上去 DBA 很轻松。但是一到晚上,你们的活儿才刚刚开始。有索引重建,磁盘告警了;有 ETL Job 失败,数据库卡住了;有集群节点宕机,需要更换机器了,等等。总之 7*24 的重活,累活都来了,而且是必须赶在天亮业务开始之前修复。有时候,那些夜猫子也很凶悍,大晚上非还要抢点货,点个夜宵啥的。一下单,系统崩溃了,你的美梦也就泡汤了。或许你感冒了,正在休息,不行你得起来;或许你正在电影院看着复联呢,不行,你得回公司。总之,为了工作,为了抢修数据库,你必须第一时间赶赴现场。多少年轻的DBA都曾在高压现场,留下了人生中第一口鲜血。

你说DBA那么累,傻子才选,你走第二条路,扯皮!

恭喜你,你选了一条可以通向公司高层的路。也许是 CTO,也许是CEO。通过做数据运行,数据产品,或者数据分析,你认识了全公司上上下下的大小头目,今天与运营总监吃个饭,明天与生产总监喝个咖啡。总之他们提的一切需求,都希望你全部搞定。你说你团队人手不够,公司不肯招人,跟他们有什么关系?你说你excel就能实现的功能,为什么非要整一套炫酷而无任何实用价值的可视化报表分析软件?他们就想要!你说你这个需求要1个月才能做好,他们拍着你的肩膀说,“你可以的,要相信自己。俩天,顶多两天就能搞定!”

你带着这么多需求回到你的办公室,看着满脸青春的这些小伙小姑娘们,刷着微博,舔着朋友圈,个个脸上洋溢着热焦玛的香气。你好忍心让他们陪你加班到凌晨,还自费打滴滴么!

好不容易,2个shot的星爸爸热焦玛下肚,你来了精神。熬到凌晨2点,连续2,3天回家看不到老婆/老公的笑脸,还给自己打气,一切都是为了家庭。等到交上报告一看,“这里数据改一下,口径要和运营部统一”,“哪里整个版面太丑了,影响公司形象,再修得漂亮一些。还有,这些报表都要加上权限,不能让其他部门人看到。好吧,明天下班前我们再谈”。

好吧,这回你只得厚起脸皮请小朋友们一起改了,晚餐自费交了KFC全家桶,全组加班人员,一律打车报销。你默默的在群里丢了一个又一个红包。收到一个又一个的“老板帅气,老板再来一个,宝宝没抢到”

终于赶在deadline之前做完了,“怎么样,我说你可以的吧,看好你哦。这样,我们昨天几个人会后碰了下,发现你原来的设计也挺好,只是稍微还要再改改;还有,数据需要增加导入导出功能…”

如此反反复复,来来回回的折腾,某天你突然感慨,原来“别人用了一年,真的学到了我十年所用会的SQL技术”。此时,你会坚持自己的选择是对的吗,假如不幸的是,公司投资人撤资了,你所熟悉的环境没了,怎么办?

因此,在这些零零碎碎的项目锻炼中,你能否总结有效的规律,提高自己业务沟通的能力,掌握数据治理的策略,严格把控项目管理的进度,都成了你的必修课。一旦松懈和迷茫,可真是万劫不复!

十,SQL 数据库必读书单

如果你选的是 DBA,除了各家数据库文档要通读之外,还需要补充云计算相关:

《数据库系统实现》

《云计算通俗讲义》

《让云落地:云计算服务模式》

《云计算架构技术与实践》

《Kubernates权威指南》

《微服务架构设计模式》

如果你选的是业务设计(无论是运营,产品,数据分析,尤其是数据分析师),那么这些书,肯定是要读一读的

Kimball 的系列书:

《维度建模权威指南》

《数据仓库与商业智能宝典-成功设计、部署和维护 DW/BI 系统》

业务场景解决方案:

《计算广告》

《推荐系统实战》

《决战大数据》

《大数据之路-阿里巴巴大数据实践》

《企业IT架构转型之道》

《设计数据密集型应用》

大数据系列:

《Hadoop 权威指南》

《Spark 权威指南》

《Hive 编程》

《Hive 实战》

《Spark 高级数据分析》

《Hadoop构建数据仓库实践》

以上就是基本路线了,能在5-10年搭好这个基础,你定当可以独当一面。

--------

黄神在微信公众号【有关SQL】中分享了很多有关数据库体系,性能调优,高可用高并发的电子书,扫码关注,回复 1024 ,便可拿到!还有实战SQL源代码,涵盖字典表翻译,性能调优,数据库迁移等,回复 5000 ,便可得。

6beAbyM.jpg!web

长按关注


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK