37

如何批量下载上海证券交易所上市公司年报

 4 years ago
source link: http://mp.weixin.qq.com/s?__biz=MzI1MTE2ODg4MA%3D%3D&%3Bmid=2650072465&%3Bidx=2&%3Bsn=9365586fdbfb0935f82576031620fb6d
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

一、简介

上海证券交易所上市公司定期报告下载,项目地址 https://github.com/thunderhit/shreport

  • github地址 https://github.com/thunderhit/shreport

  • pypi地址 https://pypi.org/project/shreport

二、安装

三、功能说明

四、快速入门

一定要先获得cookies后才能使用下面的所有代码,这里先直接看代码使用情况,cookies获取可见文档 五、获取cookies

4.1 获取上证交易所上市公司目录

Run

代码中的sh.companys()获取的是DataFrame数据类型,所以大家还可以自己存储成excel

4.2下载某公司所有定期报告文件

绝大多数报告文件名格式

yaaa6rQ.png!web

代码

Run

4.3 获取某公司的所有定期报告url

如果暂时不想下载定期报告pdf文件,可以只得到该公司所有的报告文件链接

Run

五、获取cookies

一定要先获得cookies后才能使用所有的代码,获取方法

  1. 浏览器访问http://www.sse.com.cn/disclosure/overview/

  2. 按F12(mac按option+command+I)打开开发者工具的Network

  3. 刷新网页,耐心寻找与www.sse.com.cn有关的任意网址,找到cookies

b2umiaA.gif

如果

如果您是经管人文社科专业背景,编程小白,面临海量文本数据采集和处理分析艰巨任务,个人建议学习 《python网络爬虫与文本数据分析》 视频课。作为文科生,一样也是从两眼一抹黑开始,这门课程是用五年时间凝缩出来的。自认为讲的很通俗易懂o( ̄︶ ̄)o,

  • python入门

  • 网络爬虫

  • 数据读取

  • 文本分析入门

  • 机器学习与文本分析

  • 文本分析在经管研究中的应用

感兴趣的童鞋不妨 戳一下 《python网络爬虫与文本数据分析》 进来看看~

精彩回顾

Python网络爬虫与文本数据分析

如何使用Python快速构建领域内情感词典

Seaborn:一行代码生成酷炫狂拽的数据集可视化

50题matplotlib从入门到精通

30例 | 一文搞懂python日期时间处理

pdfkit | 自动化利器,生成PDF就靠它了

中文文本数据逻辑性分析库

中文文本分析相关资源汇总

cnsenti中文情绪情感分析库

Python全栈-60天精通之路

Python数据分析相关学习资源汇总帖

漂亮~pandas可以无缝衔接Bokeh

综述:文本分析在市场营销研究中的应用

2020年B站跨年晚会弹幕内容分析

YelpDaset: 酒店管理类数据集10+G

Loughran&McDonald金融文本情感分析库


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK