1

5分钟用Python爬取整个网站,你值得拥有

 2 years ago
source link: https://bbs.hupu.com/43972298.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

5分钟用Python爬取整个网站,你值得拥有

67回复

/3亮  172527 浏览

视频无法播放,浏览器版本过低,请升级浏览器或者使用其他浏览器

发自虎扑iPhone客户端
这些回帖亮了





我记得当时学的时候说,好多网站现在都反爬,但nike官网的robots协议很有意思,第一行是用nike的slogan改了一下,告诉你随便爬,以及最下面还有大大的nike标志

发自虎扑Android客户端

没看懂,有人能说说吗?

发自虎扑Android客户端





我记得当时学的时候说,好多网站现在都反爬,但nike官网的robots协议很有意思,第一行是用nike的slogan改了一下,告诉你随便爬,以及最下面还有大大的nike标志

发自虎扑Android客户端

引用 @拜拜639 发表的:

没看懂,有人能说说吗?



python的request和bs4库 一个用来访问网页一个用来解析网页 最后dump储存内容 只能自己随便玩玩

发自虎扑iPhone客户端

引用 @刻晴天下第一 发表的:

我记得当时学的时候说,好多网站现在都反爬,但nike官网的robots协议很有意思,第一行是用nike的slogan改了一下,告诉你随便爬,以及最下面还有大大的nike标志[多图]

这个是怎么用?可以抢鞋?

发自虎扑Android客户端

您需要登录后才可以回复,请登录或者立即注册

本网站隶属于虎扑(上海)文化传播股份有限公司,致力于体育电竞娱乐范畴的文化产业发展。

成立于2004年,前身为虎扑体育网。2009年虎扑体育网成为中国最大的体育网站。从虎扑体育网成立至今,内容丰富广泛,除了体育赛事,

其影视区举办的女神大赛已经破圈引发数位明星互动,装备鉴定区发展迅速已经独立出去成立为得物app。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK