21

你的博客可能被爬了 - 寒冰大大

 4 years ago
source link: https://www.cnblogs.com/zsx6/p/11246325.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

UPD:我这篇博客也被爬了

UPD:爱码网也会爬,并且会把爬的文章组到一个账号里面

UPD:怎样看自己博客有没有被爬。(by本人的知乎,但是懒得重新上传图片了)

A:将自己博客第一段话复制并百度,看看有没有完全匹配的(但是得有能标识的东西,比如by:xxx,而不是完全的题面)

知乎地址

今天发了一篇(睿智的)博客

v2-1045a2025c9087cdc9f56f7b9233211c_hd.jpg

然后想百度一下看看收录了没有

v2-45e08cc7c3594dc2782b5c63ed5b8de5_hd.jpg

诶,布布扣,我根本没用过这个网站啊?点进去一看

v2-379343b29010cdf357b586ce52b1afca_hd.jpg

WTF?这个格式都一样,还有这个QQ群,BY:MMM。而且貌似少了某句,虽然公布了原地址(截图截不下),总所周知,博客园不可声明不可转载(可能只是我没找到)

UPD[已经和博客园管理说明,并且这篇文章删了,但是其他还是在的]

可能我只是一个小概率事件,于是打开同桌的博客:

v2-3c678eece5e869574e501e194ceb2316_hd.jpg

这种毒瘤的标题应该没有敢爬的吧。

码农教程连原地址都没发,下面两个至少声明了文章来源。

码农教程copy的博客

v2-f89447f4ba9d0ec0359dde7eefec7403_hd.png
v2-cb3196491ac76ea2f64749b987443a28_hd.png
v2-5d626e78a13d36cbb92b952f88f5b861_hd.jpg
v2-4cbfdf158578cc47a799230bee591850_hd.jpg

他本人的反应

可能这不是一个小概率事件,于是我又搜索了一篇文章

v2-76e43d050c5d87a0d05d21985cb16626_hd.jpg

?????这是什么操作啊,刚写了就被爬了,码农教程还是没有标记原文

再次附上证据 原文 被爬的

?????这能否算侵权呢?就因为博客园不能设置“禁止转载”

可是这都是自己手码出来的,难到你愿意看见自己辛辛苦苦写出来的博客,就被别人复制粘贴,然而连作者和原文地址都不标出来,况且这篇文章应该是以“官方”的名义发出来的。

难以理解,这些网站,难到就不知道版权意识吗,如果人家愿意删除,那就算了

v2-5df677cfd6052e1aed8aeefcc2fd60f9_hd.jpg

可是过了快半个小时,这个网站点进去还是在的,而且还在搜索榜的第一名,而且访问绝对没有问题: 侵权连接

那我就想问,这些网站到低“偷”了多少文章?

于是我打开百度搜索这些文章中有辨识度的:

v2-6fde5f5550be0e87035b8167db3f9c38_hd.jpg

全部都可以在博客园或者CSDN找到

那么我想可能是这些网站不敢爬禁止转载的博客,那么这个怎么说呢?

v2-4ffa7c0a0bbe394d6ebdfc63a8ef6787_hd.jpg
v2-124d48830694b3aae1b81b748556dfad_hd.jpg

简直就是无视版权!互联网的流氓!希望被爬文章的受害者联合起来,在中央网信办举报这些网站!

快视频:剽窃了B站的数据库?360的常规操作了。 近乎一样的性质,甚至更加恶劣,连作者都没标明(至于快视频还没改作者的头像和ID)。可以说是互联网时代的另一个毒瘤了

 买流量赚黑心钱的网站!

1595467-20190725215225834-1493122260.png对他们来说:版权,版权个屁 


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK