2
求指路淘宝爬虫姿势
source link: https://www.v2ex.com/t/809639
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
求指路淘宝爬虫姿势 - V2EX
现在有个需求,需要爬某品类下不同商家的大量商品详情及图片,总量约十万级别,预算比较充足,请问现在有靠谱的方法吗,是不是会面临比较大的政策风险 = =
求指路,感激不尽
求指路,感激不尽
21 条回复 • 2021-10-22 10:48:32 +08:00
eason1874 10 小时 44 分钟前
@johnsonshu #12 法律很灵活,主要看你的财力和法务团队的能力。今日头条的历史就是一部爬虫与法律关系史。
1 、今日头条发家的时候肆无忌惮地采集,根据不管 robots.txt ,一律抓取放到自己网站,被百度、腾讯、微博等很多大网站和报纸起诉,一些和解转为合作,一些赔点钱。
2 、后来反过来,有个小公司采集今日头条的视频,几个主要人员被判刑和罚款,全国首例“爬虫”技术侵入计算机系统案。
3 、今日头条被微博 robots.txt 拉黑,他们还反过来起诉微博不正当竞争,2017 一审胜诉,2021 二审才改判败诉。
1 、今日头条发家的时候肆无忌惮地采集,根据不管 robots.txt ,一律抓取放到自己网站,被百度、腾讯、微博等很多大网站和报纸起诉,一些和解转为合作,一些赔点钱。
2 、后来反过来,有个小公司采集今日头条的视频,几个主要人员被判刑和罚款,全国首例“爬虫”技术侵入计算机系统案。
3 、今日头条被微博 robots.txt 拉黑,他们还反过来起诉微博不正当竞争,2017 一审胜诉,2021 二审才改判败诉。
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK