如何批量下载上海证券交易所上市公司年报
source link: http://mp.weixin.qq.com/s?__biz=MzI1MTE2ODg4MA%3D%3D&%3Bmid=2650072465&%3Bidx=2&%3Bsn=9365586fdbfb0935f82576031620fb6d
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
一、简介
上海证券交易所上市公司定期报告下载,项目地址 https://github.com/thunderhit/shreport
-
github地址 https://github.com/thunderhit/shreport
-
pypi地址 https://pypi.org/project/shreport
二、安装
三、功能说明
四、快速入门
一定要先获得cookies后才能使用下面的所有代码,这里先直接看代码使用情况,cookies获取可见文档 五、获取cookies
4.1 获取上证交易所上市公司目录
Run
代码中的sh.companys()获取的是DataFrame数据类型,所以大家还可以自己存储成excel
4.2下载某公司所有定期报告文件
绝大多数报告文件名格式
代码
Run
4.3 获取某公司的所有定期报告url
如果暂时不想下载定期报告pdf文件,可以只得到该公司所有的报告文件链接
Run
五、获取cookies
一定要先获得cookies后才能使用所有的代码,获取方法
-
浏览器访问http://www.sse.com.cn/disclosure/overview/
-
按F12(mac按option+command+I)打开开发者工具的Network
-
刷新网页,耐心寻找与www.sse.com.cn有关的任意网址,找到cookies
如果
如果您是经管人文社科专业背景,编程小白,面临海量文本数据采集和处理分析艰巨任务,个人建议学习 《python网络爬虫与文本数据分析》 视频课。作为文科生,一样也是从两眼一抹黑开始,这门课程是用五年时间凝缩出来的。自认为讲的很通俗易懂o( ̄︶ ̄)o,
-
python入门
-
网络爬虫
-
数据读取
-
文本分析入门
-
机器学习与文本分析
-
文本分析在经管研究中的应用
感兴趣的童鞋不妨 戳一下 《python网络爬虫与文本数据分析》 进来看看~
精彩回顾
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK