61

GitHub 超过半数是重复代码

 6 years ago
source link: http://www.solidot.org/story?sid=54614
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

GitHub 超过半数是重复代码

pigsrollaroundinthem (39396)发表于 2017年11月24日 13时24分 星期五 新浪微博分享 豆瓣分享 来自fork

GitHub 的一个使命是共享代码,所以发现其平台上重复代码比例高达七成并不是令人吃惊的事情。8 名研究人员组成的国际团队原计划并不是测量 GitHub 上的重复代码,而是调查不同克隆库之间的文件差异,结果发现了惊人比例的文件级复制,因而改变了研究方向。研究人员发现,GitHub 上 4.28 亿文件中只有 8500 万是唯一的。研究报告发表在 OOPSLA SPLASH 会议上。JavaScript 是克隆最多的环境,94% 的 JavaScript 文件是复制的;73% 的 C++ 文件是重复的,而 Python 程序则是 71%。Java 是其中最独特的,但重复比例也达到了 40%。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK