12

CPP 3.0:从课题组到科技公司

 3 years ago
source link: https://zhuanlan.zhihu.com/p/30935455
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

CPP 3.0:从课题组到科技公司

厦门量潮科技有限公司 执行董事

写在前面

去年的今天是我的20岁生日,我发布了2.0的升级转型计划(CPP 2.0计划: 项目升级计划);今年的今天是我的20岁生日,这次发布3.0的升级转型成果;不知道这以后会不会成为每年生日的一个习惯。

将近两年的时间,创始的组织一步一步从1.0的经济学课题组,走向2.0的经济学技术社团组织,走向3.0的经济学大数据科技公司,整个团队和团队的每一个成员都有了很大的改变和进步。借此机会感谢所有帮助过我们和正在帮助我们的朋友们,我们成长至今离不开你们的帮助和鼓励。我们会坚定不移地做经济与商业大数据领域的耕耘者,一年一年地做下去,在这个过程中塑造我们自己、影响更多的个人和团队。我们要做的每一年事情都可能很难做,但是我们还是会一直做下去。

从2.0到3.0的整个过程中我们一直试图在回答一个最根本的问题,我们如何才能稳定的生存下来。很多问题一直如影随行:资金长期匮乏、人力资源不足、技术积累不足、研究进展缓慢……很多时候我们也会时常迷茫,怎么才能让组织保持长期稳定,怎么才能给自己造血让自己生存下来。从6月份导师提议注册公司开始,几个月以来团队在一轮一轮磨合关于公司的方方面面,从组织架构到各项制度,一点一点改组和完善整个框架。10月底我们正式开始启动公司注册流程,预计这个月或者下个月可以正式挂牌成立。这是一次全新的尝试,可能没有人知道结果会如何,但可能是我们现阶段最好的选择,所以即使风险再大,我们也会尝试一次,以一个创业者的心态,重新开始每一个环节。

下面的部分,分享一下我们的现状,希望可以得到更多的建议和经验,如果有意向加入我们欢迎联系。


组织简介

China’s Prices Project(数果科技)是一个起源于经济学课题组的、致力于问题驱动、数据驱动、技术驱动和组织驱动经济学大数据理论研究和工程实践、培养面向未来的跨学科大数据人才的科技公司。厦门大学最大的本科生经济学课题组、最大的社科与商业大数据课题组、最大的Python技术团队、最大的社科数据服务团队、最大的跨学科大数据人才培养基地。

CPP团队是一支快速迭代、快速进化的高成长性、高创新力的团队。团队成员背景多元,来自厦大内10个学院及厦大外6个学校或单位,思想交流和碰撞频繁,互相包容、理解和学习。团队成员对团队的忠诚度和参与度很高,充满热情和活力,团队成员之间相处融洽,团队氛围好。团队以问题、数据、技术和组织驱动创新,面对复杂问题的反应能力强,解决问题严谨仔细。

在现期,我们起步于中国线上类CPI价格指数编制电商平台搜索排序算法设计的研究,以此为引擎驱动数据采集、数据管理、数据清洗、数据分析、数据挖掘、数据可视化等社科与商科多领域大数据理论研究与工程实践的知识与经验积累,通过科研服务和课程服务为科研机构和团队输出解决方案和培养人才。

在远期,我们致力于应用跨学科、跨领域方法和技术解决大数据问题,积累大数据问题解决方案和工具链,孵化数据与技术驱动的优秀产品与团队,在此过程中培养未来学界和业界需要的、可以适应变化的、积极探索创新的、包括但不限于研究、技术、产品、营销、公关、法务、财务、人力资源、行政等各个方面的人才。

创始人简介

张果,CPP创始人、执行董事和CEO。厦门大学王亚南经济研究院(WISE)经济学国际化试点班2014级本科生,辅修王亚南经济研究院数理统计。百胜中国数据分析师实习生,数据分析部门唯一的本科生实习生。茅家铭老师(WISE)、赵万磊老师(厦门大学计算机系)、覃志刚老师(厦门大学经济学院)等教授合作者,Thomas Sargent(2011诺贝尔经济学奖得主,纽约大学Stern商学院)、Victor Couture和Benjamin Faber(加州大学伯克利分校)等教授及项目助研,丁煜老师(厦门大学公共事务学院)、龙小宁老师(WISE)、游家兴老师(厦门大学管理学院)、傅馨老师(厦门大学管理学院)等教授及课题组技术支持或技术顾问。Sargent教授等指导的QuantEcon团队开发者,Python子库Copula开发团队项目负责人。厦门大学钦车孰路实践队队员、New Angle创业团队队员,租奇制胜、知无央、厦城骑士、新享事成等本科生实践队的学术指导或学术顾问。

研究领域为基于动态结构实证方法的产业组织,研究方向为互联网平台的算法与机制设计、经济学与商业大数据理论与应用。精通网页爬虫、数据清洗、数据分析、数据可视化、分布式计算等大数据技术;精通Python、R、SQL、MongoDB、LaTeX、Tableau、Hadoop等语言与工具,熟悉Stata、MATLAB、C、HTML、CSS、JS等语言。创始和组织各类项目经验丰富,曾经和正在参与包括五个作为创始人的二十余个项目或组织。人才培养经验丰富,CPP团队的学术、技术、产品、营销、人力资源、组织管理等方向的首要指导者。

大事记

  • 2016年2月,中国线上类CPI高频价格指数编制项目立项,CPP正式成立。
  • 2016年4月,Tmall和JD爬虫上线。
  • 2016年6月,知乎专栏(https://zhuanlan.zhihu.com/xmucpp)上线,受到学院内外老师和硕博、知乎经济学圈关注。
  • 2016年6月,科研服务业务启动。
  • 2016年9月,微信公众号(XMUCPP)上线。
  • 2016年9月,GitHub组织上线。
  • 2016年10月,官方网站(http://www.xmucpp.com)上线。
  • 2016年10月,分布式+自动化运维数据采集系统1.0上线。
  • 2016年10月,电商平台搜索排序算法设计项目立项。
  • 2017年3月,分布式+自动化运维数据采集系统2.0上线。
  • 2017年3月,助研组织业务启动。
  • 2017年10月,“起航计划”大数据精品课程业务启动。
  • 2017年10月,注册公司流程正式启动。

学术研究

CPP的经济学研究围绕互联网平台展开,包括研究互联网平台的产业组织和利用互联网数据研究新问题或者发展新方法,结合大数据理论与技术实现方案。CPP的主要研究课题如下:

中国线上类CPI高频价格指数编制

本项目立项于2016年2月,项目主持人为张果,项目导师为茅家铭老师和赵万磊老师。本项目参考MIT的Billion Prices Project的工作,基于网页爬虫、数据库、数据挖掘技术,以天猫、京东等电商平台作为主要数据来源,参考中国官方CPI编制标准,编制中国高频线上价格指数,一方面更快速地提供价格水平信息,另一方面也检验阿里公布的iSPI指数和清数公布的iCPI指数的可靠性。

电商平台搜索排序算法设计

本项目立项于2016年10月,项目主持人为张果,项目导师为茅家铭老师。本项目扩展Levin(2014)关于用户搜索与平台设计的模型,研究在零售商平台的背景下,以往期销量作为商品质量代理变量的搜索排序算法如何影响零售商定价的动态变化,用以指导零售商平台修改算法权重,优化搜索结果,增加社会福利。

技术积累

CPP以经济学研究需求为驱动引擎,围绕研究课题积累核心大数据技术,并以核心技术为根基扩展相关技术积累。CPP的主要技术积累如下:

高频电商价格数据系统

为了满足经济学研究的数据需求,CPP正在搭建一套完整的高频电商价格数据系统。系统主要基于Python、Linux Shell和MySQL实现,主要包括五个部分:数据采集系统、数据仓库系统、实时CPI计算系统、数据分析系统、服务器调度系统。

已经上线的系统模块包括:

  • 基于Python的Tmall、JD等电商平台的、结合网页爬虫技术的数据采集系统。
  • 基于Python和Linux Shell的、结合分布式系统和自动化运维技术的服务器调度系统。

正在搭建的系统模块包括:

  • 基于Python和MySQL的、结合分布式系统和数据库技术的数据仓库系统。
  • 基于Python和MySQL的、结合分布式数据库和分布式计算的实时CPI计算系统。
  • 基于Python和MySQL的、结合分布式数据库和分布式计算的海量数据分析与挖掘系统。

技术博客与技术分享

开设知乎专栏和微信公众号一年半以来,已经积累了100余篇各类技术教程和经验分享博客。主要包括:

  • Python入门系列
  • Python爬虫系列
  • Pandas入门系列
  • R语言入门系列
  • LaTeX入门系列
  • CMD入门系列
  • 数据挖掘系列
  • 数据可视化系列
  • 本科生科研经验分享系列

盈利业务

CPP通过学术研究驱动技术积累,通过输出技术积累和相关经验,摸索盈利模式、拓宽人脉资源、培养后备梯队、输出价值观,为下一轮的进化提供资金和人力基础。CPP的盈利业务目前包括“授人以鱼”的科研服务和“授人以渔”的课程服务两大业务,还在艰难地试水中。

科研服务

CPP为高校的科研团队和个人提供数据服务、培训服务、网站服务、项目组织服务等科研服务,主要包括数据采集、数据清洗、数据分析、数据可视化、数据科学相关培训、科研工作者和科研项目网站制作、大规模助研项目的组织等。我们已经和正在合作的老师包括傅馨老师、廖谋华老师、龙小宁老师、蒙莉娜老师、王璐航老师,游家兴老师等(按拼音排序),累计完成的项目已有近20个。

课程服务

“起航计划”大数据精品系列课程启动于2017年10月,是CPP对“培养面向未来的跨学科大数据人才”的远期目标的第一次公开实践,是近50位CPPers一起奋斗近两年的技术积累、组织经验积累和人才培养经验积累的集中整合和公开分享。CPP希望通过通过起航计划,为在黑暗中摸索的同龄人点亮一座在社科与商业大数据领域的灯塔,帮助同龄人们向着自己梦想的大海起航,因此取名“起航计划”。“起航计划”旨在通过从零基础到工业实践的大数据编程课程,帮助编程初学者更快地找到正确的学习方向,培养有效率的编程学习习惯,接触和了解学界和业界大数据领域的最新动态,积累参与科研、工业或者项目的必备技能点,在实习、升学、就业中取得独一无二的优势。“起航计划”的主要课程包括:

  • Python工程师系列课程。本系列课程启动于2017年10月,是“起航计划”的起点系列课程。Python是大数据的基础设施之一,也是最容易切入的入口。Python工程师系列旨在帮助学员了解什么是编程,帮助学员找到正确的学习方向和有效率的编程学习习惯,培养基本的编程思维和编程能力,为后续系列课程打下基础。深入本系列课程相关知识,可以成为一个合格的业界Python工程师。本系列课程主要包括:
    • Python入门:指导安装和配置Python环境,介绍Python的基础语法、基本数据类型、控制语句、函数等基础知识,帮助学员了解什么是编程和什么是Python。
    • Python进阶:介绍Python的面向对象基础和函数进阶知识、基于Python的数据结构和算法的简单入门,帮助学员了解什么是Pythonic的代码和什么是好的编程习惯。
    • Python实战:实现一个简单的爬虫的四个部分,解析、请求、储存、并发或并行,并组装成一个完整的爬虫项目,指导学员实现一个简单完整的实战项目。
  • Python爬虫系列课程。正在研发中,预计2018年上线。
  • Python+R+SQL数据分析系列课程。正在研发中,预计2018年上线。
  • LaTeX系列课程。正在研发中,预计2018年上线。

“起航计划”的主要亮点包括:

  • 技术过硬、善于教学的优质讲师
  • 高比例、认真负责的优质助教课程运营
  • 精心设计、贴近项目需求的作业
  • 海量的优惠政策;
  • 海量的后续项目机会;
  • 贴心的人文关怀。

团队组织

组织架构

  • 研究部门:负责支持学术研究的数据分析。
    • 数据组:负责描述统计和可视化。
    • 算法组:负责模型和算法优化。
    • 文本组:负责文本数据清洗和分析。
  • 工程部门:负责搭建和维护数据仓库系统。
    • 爬虫组:负责搭建数据采集系统。
    • 数据库组:负责搭建数据库系统。
    • 运维组:负责维护数据仓库系统和管理数据。
  • 网站部门:负责网站搭建和网站内容。
  • 市场部门:负责盈利业务的组织
    • 科研服务组:负责组织科研数据服务和助研组织服务。
    • 课程服务组:负责课程服务的组织。
  • 宣传部门:负责宣传平台运营和内容生产。
  • 法务部门:负责法务管理和组织模式设计。
  • 财务部门:负责财务管理。
  • HR部门:负责招募管理和协调。
  • 行政部门:负责日常管理。
  • 全球团队:
    • 开源库研究组:负责组织参与QuantEcon.py的开发

激励机制

CPP的核心激励设计原则是“激励相容”,通过一系列复杂多样的、财务和非财务的、显性与隐性的激励机制兼容不同背景和不同需求的成员,用最低的成本实现最高效的激励。CPP的主要激励机制体现在团队文化、培养体系、简历增值、财务激励等方面。

  • 团队文化。团队文化作为团队的根基,是任何激励机制得以有效的基础。CPP通过营造目标清晰、积极进取、步步为营、坚韧执着、追求品质的工作习惯,和热情活跃、友善合作的日常氛围,努力让团队成员长期保持对团队的忠诚度和热情保持团队的稳定,通过激发团队成员内心的渴望增强工作动力,通过严谨犀利的指导交流帮助团队成员理清方向与思路,通过完善的培养体系和良好的互助习惯帮助团队成员成长,通过鼓励团队成员发展自己的兴趣和能力来提高团队成员的长期潜在利益,以推动团队整体保持高速发展。
  • 培养体系。建立在团队文化基础上的培养体系主要包括专业技能和管理决策两方面。专业技能主要通过零基础入门课程、专题进阶讲座和难题攻关小灶,科普跨学科专业知识和解决技术难题。管理决策能力主要通过引导团队成员在项目里主动犯错、通过各种讨论和会议提出问题并引导团队成员寻找解决方案,通过总结和分享历史经验帮助下一轮项目的优化,帮助团队成员、特别是核心成员培养管理团队的能力和面临各种选择的决策能力。
  • 简历增值。所有团队成员做出的成果,CPP都会优先承认其个人的努力,鼓励团队成员写入个人简历,并尽力为团队成员个人宣传。CPP鼓励团队成员在承认团队整体的贡献的情况下,用自己及主要贡献者为团队做的项目带领其他贡献者申请比赛和项目,用以获得奖项和立项资格,并写入团队成员个人简历。
  • 财务激励。CPP的财务激励机制正在建立中。CPP的财务激励机制主要包括项目抽成、固定补贴、奖金、股权等方式。技术线和营销线主力成员通过直接参与盈利项目抽成获取收入,职能线主要通过发放固定补贴,有重大贡献的成员发放额外奖金,管理层全员持股实现股权激励。

联系我们

联系邮箱

宣传平台


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK