3

第八届中国 R 语言会议(上海)纪要

 2 years ago
source link: https://cosx.org/2015/12/8th-china-r-shanghai-summary/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

第八届中国 R 语言会议(上海)纪要

第八届中国 R 语言会议(上海会场)于 2015 年 11 月 21 日至 22 日在华东师范大学中山北路校区成功举办。会议分为第一天的主会场和第二天的四个分会场,第一天主会场位于大礼堂(思群堂),第二天分会场位于科学会堂报告厅和逸夫楼一楼报告厅。

一、会议概况

第八届中国 R 语言会议(上海会场)由华东师范大学经济与管理学部统计学院和统计之都联合主办,并得到了华院数据、辰智咨询、永洪科技、优酷土豆集团等战略合作伙伴的鼎力协助。在华东师范大学统计学院、统计之都各位同仁的不懈努力下,本次会议比往届有了更大的突破。会议共设有 5 个会场,32 场主题报告,覆盖金融大数据、工具与可视化、互联网、统计与机器学习等诸多领域。本届会议报名非常火爆,人数突破了 1500 人,报名单位超过 600 个,创下历届之最。

本次大会最年轻的报名者为 17 岁,最年长为 53 岁。报名者的中位数为 26 岁,年龄分布的直方图如下:

本次大会报名者的男女比例约为 3:2。

报名者最多来自上海,比例为 89%。其次分别是杭州、北京、南京。

本次大会的报名者来自 600 多家单位,参会单位的前 6 位均为高等院校,其中华东师范大学和上海财经大学分占一二位。上海外的院校中,浙江大学的报名人数最多。非院校机构单位中,携程旅行网的报名人数最多。

本次大会参会者职务以数据分析师居多,其次是在校的研究生。

本次大会大家感兴趣的内容首先是 R 语言,其次就是金融大数据、大数据、数据挖掘等。

二、会议内容

本次会议分为第一天的主会场和第二天的四个分会场。主会场演讲嘉宾包括学界杰出代表、业界大咖等。分会场包括金融大数据专场、工具及可视化专场、互联网专场及统计与机器学习专场,涵盖了数据科学的各个领域,讨论了数据科学在诸多领域的最新进展。

1、会议致辞

会议在经济与管理学部统计学院副院长张日权教授的致辞中拉开帷幕。张日权教授对统计学院的现状与发展进行了概述,并对数据科学的重要意义进行了阐述,发人深省、引人思考。

随后,会议主席练勇强也对本次会议进行了致辞。他对自身学习 R 语言的经历做了简要介绍,回顾过去又不忘展望未来,并对辛勤工作的志愿者以及主办方表达了感谢。

2、宣晓华:数据科学家的机遇、成长和创新创业

宣晓华是大数据技术和应用公司——华院数据技术(上海)有限公司创始人和董事长。在大数据受到国家、地方政府、企业、资本等的强劲关注下,宣晓华董事长用自己的经验和事例分享了数据科学家的产生和成长,满足创新和创业的呼唤与落地。

3、熊杰超:Libra-an R package as Linearized BRegman Algorithm for High Dimensional Statistics

熊杰超是北京大学姚远教授的博士生。作为 R 包 Libra 的创建者与维护者,熊杰超博士带我们了解了 Libra 的魅力与震撼。

4、陈为:大数据时代的可视化机遇

陈为是浙江大学计算机学院 CAD&CG 国家重点实验室教授。作为数据可视化和可视分析的专家,陈为教授向我们介绍数据可视化的基本概念以及新媒体时代下的可视分析的内涵,阐述可视化学术界的近期关注重点,并展示面向大规模数值计算模拟、智慧地球、商业智能、数据新闻等应用的可视分析案例。

5、王桐:如何在一个 BI 平台上实现数据准备、探索式分析和深度分析

王桐是北京永洪商智科技有限公司副总裁。王桐副总代表永洪分析了多年积累的数据化运营最佳实践,让企业里面的每一个人都能轻松发掘大数据的价值,获取深度洞察力。

6、刘鹏:互联网变现与计算广告

刘鹏是互联网商业变现专家,《计算广告》作者,现任 360 高级总监,商业产品首席架构师。刘鹏专家讲述了大量的互联网免费产品在获得了流量与数据以后,是如何规模化地创造收入的?在后向变现的过程中,广告的地位和作用如何?用到了什么样的计算技术?深入浅出地介绍计算广告的行业背景、基本问题、常见产品与技术方向,为大家了解互联网的商业模式,更好地从事互联网行业提供有价值的指导。

7、邹庆士:利害数据与关键分析技术

邹庆士是国立台北商业大学 (商业技术学院 2004~2014) 信息与决策科学研究所教授,台湾数据科学与商业应用协会理事长,中华 R 软件学会理事长。Big Data 是近年来热门的话题之一,邹教授从 Big 的新解谈起,以数据敏感度 (data sensitive) 与数据解析 (data analytical) 思维为根基,聚焦到关键的数据上,以解析出真正不同且重要的洞见。内容穿插各式数据分析实例,引出关键的解析技术,期能让数据发挥其利害的功用。

8、谢军:当 R 真的遇到大数据:金融和学生学业质量溯因

谢军是上海雅捷信息技术股份有限公司副总经理及首席数据科学家。谢总报告了上海闵行的大数据实践,指出银行拥有大数据,典型的省级银行拥有 5000 万客户,9000 万账号,其分析基础往往是 5000 行 1000 列巨大矩阵的运算。传统技术遇到了巨大挑战。他以 GPU 为基础的大规模并行技术将数据库查询技术提速至少 500 倍。

9、叶巍岭 :秩序的作用:商品陈列整齐是否总是比凌乱好?

叶巍岭是营销学博士,现任上海财经大学国际工商管理学院市场营销系副教授。上海财经大学 “教书育人标兵”,及上海财经大学商学院杰出教学奖获得者。叶教授综合已经有的产品污染和消费者污染效应,结合本研究的 “画面效应”,以及研究团队正在进行的研究,对商品陈列整齐是不是总是比凌乱要好,作出全面的回答。针对为什么整齐的陈列(相较于凌乱的陈列)会更有利于消费者对商品给出更高的质量预估这个问题他以及团队提出了 “画面效应”,即当商品陈列整齐(相对于凌乱)时,消费者对陈列画面的态度更加积极正面,继而导致消费者对产品质量的预估评价也显著更高。其中,消费者对陈列画面的态度在画面效应中起到完全中介作用。他们进一步指出画面效应的调节变量:产品外观重要性。当消费者认为产品的外观不重要时,画面效应不发生,即凌乱与整齐的陈列不会引起消费者对陈列画面的态度差别,也不会引起消费者对产品质量预估评价的差异;而当产品的外观重要时,画面效应才会发生。

10、孙锐: R+Spark = 大数据时代的 R:SparkR 介绍

孙锐是英特尔上海大数据团队架构师,HIVE/Shark/Spark 贡献者,SparkR 主力贡献者之一。孙锐专家概要地介绍 SparkR 的背景、历史、架构、API 和状态,帮助 R 社区熟悉 SparkR,并希望能吸引 R 社区参与到 SparkR 的讨论和开发中。Spark 1.4.0 版本在 Scala, Java 和 Python 语言之外正式引入了 R 语言 API(即 SparkR)。SparkR 为熟悉 R 语言的数据科学家提供了一种新工具,使得他们能够基于 Spark 大数据平台的分布式引擎在 R 中处理大数据。

11、谢宗震:R 在开放数据的应用

谢宗震是清华统计博士,擅长与跨领域专家合作,开发的 R 包 iNEXT 被应用于生物、遗传、新闻、文学、电竞等领域。现职为 DSP 智库驱动知识长,辅导超过 300 位企业人士成为数据分析人才。谢博士讲述了开放数据为一个尚未被大量开发的巨大资源。政府、企业、非营利组织为了要完成他们的工作或是任务而收集了大量各式各样不同的数据。有越来越多的案例显示,成功的关键在于 “善用数据、跨域合作”,从掌握现况、洞悉趋势、服务创新到政策研究,数据的价值和应用层面相当广泛。这场演讲跟各位分享了透过 R 语言在政府、企业、非营利组织等开放数据进行加值应用的真实案例。

12、11 月 22 日分会场

本次会议共设有四个分会场,共 22 场报告。演讲者有来自学术界的研究人员,也有来自业界的技术大咖和数据科学家等。主题主要包括:金融大数据、工具及可视化、互联网和统计与机器学习。具体的演讲嘉宾和主题如下:

金融大数据会场

刘道明(光大云付互联网):二级市场、数据、趋势

邓一硕(懒投资):互联网金融产品创新及经营活动中的挑战

张昊(同盾科技):大数据反欺诈的实践与应用

任坤(凌云至善量化私募基金):当金融工程遇到 R

李孟育(台湾嘉义大学财经系):影响台股指数涨跌的关键变量之分析:递归分类模型之运用

工具及可视化会场

何宇兵(辰智咨询):商业大数据时代,GIS 和 R 更配

胡羡祺(Tableau):R and Tableau: Smart Meets Fast

严紫丹(陆金所):slidify+rCharts+ECharts 制作炫酷 HTML5 报告

邢代涛(SupStat):借助 API 快速搭建自然语言处理平台

张云雁(PayPal):从用 R 读琅琊榜小说讲讲用 R 读书的一些事

郎大为(雪晴数据网):数据科学的博客:从 knitr 到 jekyll

互联网会场

张翔(淘在路上):旅游 O2O 行内数据解析

熊熹(京东商城):里子和面子:R 语言及数据挖掘助力京东推荐系统

任万凤(诸葛 IO):Growth hacking?App 增长分析新玩法

谢佳标(深圳创梦天地科技):当游戏数据遇上 R 语言

唐力(携程旅行网):利用历史业务数据实现系统异常的实时监测

统计与机器学习会场

冯凌秉(澳大利亚国立大学):缺失值处理与 R 语言

杜传龙(Iowa State University):古典概率的一些通用解法

吴齐轩(国立台湾大学):Introduction to Feature Hashing

陈堰平(SupStat):贝叶斯动态线性模型的商业化应用

肖凯(开智微播):如何攒一台深度学习服务器

毛苏晗(淘在路上):旅游数据中的情感分析

三、演讲幻灯片

公开可下载的幻灯片链接:http://pan.baidu.com/s/1nu2uCcT,部分演讲视频发布在雪晴数据网:http://www.xueqing.cc/

四、会议组织

本次会议是上海举办的筹备时间最长规模最大的一次 R 会议,并且第一次由在校学生为主要组织者。在会议筹备的过程中,虽然遇到了很多棘手的问题,比如组委会大部分同学对会议筹备都缺乏经验,同学们平时课程学习时间紧迫(导致基本上每次组委会会议都在晚上 9:00 之后进行),双 11 物流扎堆等等,但是最后同学们经过自己的努力以及 4 位老师的耐心指导,还是克服了重重难关,最终成功举办了这次大会。所以首先要感谢汤银才、林祯舜、李舰、葛建辉 4 位老师的悉心指导和鼎力相助。其次感谢统计之都理事会和编辑部的成员,为会议宣传和发布做了不少工作。最后感谢华东师范大学统计学院的各位志愿者,为大会的顺利召开付出了辛劳。

本次大会的工作人员有

组委会老师:汤银才,林祯舜,李舰,葛建辉

会议主席:练勇强

副主席:刘钟毓

秘书长:龚航俊

组委会学生:胡优,王昱栋,牛青炎,邹苗苗,李浩,杨丹,王旭

统计之都:魏太云,张心雨,冯璟烁等

志愿者:路亭玉,张东,金昱成,郭明明等

主办单位

华东师范大学经济与管理学部

华东师范大学统计学院

赞助单位

优酷土豆集团

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

← COS 沙龙第 34 期(北京)纪要 COS 沙龙第 33 期(北京)纪要 →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK