5

git术语解释staging,index,cache

 3 years ago
source link: https://blogread.cn/it/article/7581?f=hot1
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

git术语解释staging,index,cache

浏览:1966次  出处信息

   当我在使用git的时候,有三个东西的出现,一度让我非常困扰,就如题所述,staging,index,和cache。

   比如,当我阅读git官网提供的电子书《Pro Git》的时候,最初一章里,就提到,文件在git里面,有三种状态,working copy,staging area,和 in repository。而在读一些man pages的时候,比如git-reset命令,又会看到index,这非常让人困扰。而git-rm 指令又有一个参数叫 -cached,其作用是”unstage and remove paths only from the index”,更加奇怪了,同时提到了stage和index,而参数名竟然是cached!!!

   

QQ20150829-1@2x.png

   这三者的来龙去脉到底怎么回事?搞清楚这些问题,对于喜欢刨根究底的我来说,极其重要。通过谷歌,我找到了一个叫Junio C Hamano的日本小哥,他是git的核心维护者之一,讲述了这三者的故事。本文主要内容从那个文章中解读出来,添加了一些自己的理解,不感冒的同学,请直接阅读原文。

   读完原文后,我的基本感觉是,这些都是Linus大神当时的一念之差和命名的随意性搞出来的问题。

   原来,Linus当年在维护Kernel的时候,使用了一种叫做“tarball and patches”的工作流模型(什么鬼?),具体原理没搞懂,我理解的意思,他要研究每个Kernel的patch对Kernel到底有什么影响。例如,他有一个2.6.12的tarball,还有 patch-1,patch-2 两个,所以,他至少要弄出来三个新版本,2.6.12-patch1,2.6.12-patch2,2.6.12-patch1&2。区区两个patch就搞出了3个新版本,如果patch多了不堪重负。

   于是,他发明了一个“目录缓存(directory cache)”,其实就是现今git中的tree的概念,这个tree上的每个节点,都是一个Kernel的整个目录结构和文件(用一种高度压缩的形式表示的)。构建这个tree的方法,就是将内容添加到“缓存cache”,或者“更新缓存cache中的内容”。

   用来存储这个树状结构的目录,叫“.dircache”(现在叫“.git”)。这个目录里,有个文件叫index,在git源码里(用C写的),操作这个index的各种变量名称,都有个前缀叫“cache”。这个index文件的作用,就是决定你要将什么文件,最终写入到那个树状结构里的,index就是暂存用的缓冲区。(可以看出来,这个树状结构,其根本作用就是维护海量的版本,其实就是git版本库本身了)(开发团队里的)每个人,都混用cache和index两个词,因为记录缓冲区(cache)内容的文件名,叫index。如果你给定文件路径,就能从index文件中找出来你要提交的内容(现在依旧如此)。

   现在,越来越多的人,不需要通过阅读git的源码,就可以使用git了(因为有了文档和很多书籍,从应用层面介绍了很多的git知识,所以不需要从源码里找到所有秘密了:D)。所以,index这个名字变得越来越流行,因为这个文件会出现在.git目录里,而源代码里,cache开头的那些变量却不为人知。最终,我们(git开发团队)不再使用cache这个单词给小白用户(End User)解释问题了,但是当我们讨论git内部数据结构和git实现的时候,还是会用到cache这个词。

   对于小白用户来说,现在 cache 这个词都以过去分词 cached 的形式出现,其词性是形容词了。表示要讨论的内容目前位于index文件中,而不是在工作目录(work tree)里面。(假如,我在工作目录里修改了一个文件,使用 git-add 命令,我修改的部分内容 —— 相当于一个patch —— 会在index里出现,但是在我的工作目录里,当然也还是有我修改的内容的,不过是叠加在版本库中的文件上的)。当然,我们也可以用 “indexed” 这个词,但是 “cached contents”,在英语里是个词组,早已存在,表达的就是这个意思,所以我们不需要再发明一个词来说明这个意思,就用了cached了(我了个去啊 >-

觉得文章有用?立即:

和朋友一起 共学习 共进步!

建议继续学习:

QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK