75
GitHub - whusnoopy/renrenBackup: A backup tool for renren.com
source link: https://github.com/whusnoopy/renrenBackup
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
README.md
renrenBackup
A backup tool for renren.com
人人网信息备份工具
基本配置
理论上 Python 2.7+ 和 Python 3.6+ 都可以用 (我是在 Windows 10 + Python 3.7.0 的环境下测试的)
用 pipenv 构建虚拟环境
pipenv --python 3.7.0 pipenv install pipenv shell
或者用 virtualenv 构建
virtualenv env
source env/bin/activate
pip install -r requirements.txt
抓取
直接运行 fetch.py
即可,相关参数见下,不输入用户名密码是不会抓取的,不带各种抓取参数就是只登陆不抓取
-s
状态-g
留言板-a
相册-b
日志-u
要抓的人的人人 uid(仅能抓取当前登录账户可见的内容)-r
强制更新已抓取用户的统计信息
# 查看详细的命令参数 $ python fetch.py --help usage: fetch.py [-h] [-s] [-g] [-a] [-b] [-u FETCH_UID] [-r] email password fetch renren data to backup positional arguments: email your renren email for login password your renren password for login optional arguments: -h, --help show this help message and exit -s, --fetch-status fetch status or not -g, --fetch-gossip fetch gossip or not -a, --fetch-album fetch album or not -b, --fetch-blog fetch blog or not -u FETCH_UID, --fetch-uid FETCH_UID user to fetch, or the login user by default -r, --refresh-count refresh fetched user count # 抓取自己的所有信息 $ python fetch.py [email protected] passwordAtRenren -s -g -a -b # 指定抓取某人的状态 $ python fetch.py [email protected] passwordAtRenren -s -u 30314 # 强制更新某人的抓取统计信息 $ python fetch.py [email protected] passwordAtRenren -u 30314 -r
如果遇到要登录验证码的情况,在终端提示时输入自动打开的图片上的四个汉字即可。如果没有自动打开验证码图片,可到项目的 /static/img/icode.jpg
找到,自行打开并输入验证码
展示
直接运行如下命令,即可在本机浏览器打开 localhost:5000
看到展示
python web.py
打包备份
将抓取的页面和静态文件统一打包,将打包文件解压后可以不启动 flask 也能查看
python export.py backup.tar
TODO
- 纯静态输出,不用启 flask 也能查看(把评论点赞数据也输出到页面,js 只控制是否展示)
- 备份打包
- 纯动态输出,学习用 Vue.js
- 可以抓别人的记录
- 同时展示多人记录
- 强制重抓之前抓挂的图(还挂就替换成默认图)
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK