2

COS 访谈第 1 期:吕晓玲

 2 years ago
source link: https://cosx.org/2013/03/interview-of-xiaolinglu/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

COS 访谈第 1 期:吕晓玲

吕晓玲 / 潘岚锋

关键词:COS 访谈; 人民大学统计学院; 数据科学

受访人:吕晓玲

统计之都今后会为大家贡献名师访谈系列文章,我们的野心是:遍访统计界名士高人!我们是统计之都,我们喂自己袋盐!

简介:吕晓玲老师是中国人民大学统计学院经济与社会统计教研室副教授,也是小编的硕士研究生导师。吕老师在学术上高度自我驱动,效率极高,能够同时把多件事情做好,让小编至今只能遥望。

吕晓玲

1. 简要介绍一下你自己(教育背景,研究兴趣,个人爱好等)

我是 1995 年至 1999 年在南开大学数学系概率论与数理统计专业理学学士毕业;1999 年至 2002 年南开大学数学系概率论与数理统计专业理学硕士毕业,导师吴喜之教授;2004 年至 2007 年香港城市大学商学院管理科学系哲学博士毕业,导师卢兴普教授。2007 年 2 月至 6 月在奥地利 Johannes Kepler University of Linz 大学访问,导师是 Sylvia Fruehwirth-Schnatter 教授;2012 年 1 月至 2013 年 1 月在伯克利大学访问,导师是郁彬教授。

自 2007 年 9 月开始在中国人民大学统计学院工作,研究方向为:统计机器学习算法及应用,统计模型在市场营销、消费者行为分析领域的研究与应用。

谈不上有什么真正的个人爱好,惭愧。

2. 请谈谈当初为什么选择进入统计或数据分析领域(例如受谁影响最大,欣赏统计的哪方面)

说实话,95 年高考时填了概率论与数理统计这个专业,是班主任的建议,自己什么也不了解。拿到通知书,一看是数学系,还大哭了一场。没有勇气复读,也就硬着头皮去了。学着学着,自然而然就喜欢上了。欣赏统计的哪方面呢?我觉得统计是方法论层面的一门学科,在其对世界本体论和认识论的基础上,有着自己认识世界、解释世界的一套原则和理论,既是科学,也是艺术。一路求学的过程中,让我印象很深刻,对我影响很大的老师有南开大学的王公恕老师,《数理统计》还有《多元统计》这两门课是王老师讲的,他讲课太清楚了,听着是一种享受。我的硕士导师是吴喜之老师,所有人都敬佩他的学问和人格,我也不例外。我的博士导师是卢兴普老师,他非常亲切和蔼,治学极其严谨。我在奥地利访问的导师是 Sylvia Fruehwirth-Schnatter,我和她交往的时间并不多,印象很深刻的是她非常聪明,并且是绝对的女强人。我在伯克利访问的导师是郁彬老师,她是我可望不可及的偶像。

3. 请谈谈你的研究成果、贡献(例如最自豪的一篇论文或最成功的一个项目或最有趣的一个研究话题等)

还是很惭愧,没什么值得一提的科研成果或者贡献。有几个印象比较深刻的项目可以说一说。1998 年本科的时候,多元统计的任课教师王公恕老师和历史系的一名教授是好朋友,因此拿到一些清朝区域人才变迁的数据。数据量很小,我尝试使用各种多元分析的方法处理这个数据,得到一些很有意思的结论。2000 年硕士二年级,当时数据挖掘刚刚兴起。我有机会访问香港城市大学管理科学系数据挖掘中心,作研究助理。第一个项目是给《南华早报》网站的求职板块分析网络日志数据,当时八张光盘的原始数据对我来讲也是一个不小的挑战。绝大部分时间是编程序进行数据清理,到现在为止,我也认为数据挖掘七八成的功夫是数据预处理。

2004 年至 2007 年博士期间,我拿到一年的香港收视数据。我现在还记得清楚,当时我的导师给了我一个 80G 的硬盘存储原始还有处理过的数据。分析这个数据的目的是了解香港人收看电视节目的规律,给香港无线电视台提供一些建议。近年我接触了一些机器学习、文本挖掘的研究。2012 年在伯克利大学访问期间,参与了郁彬老师的一个文本挖掘的项目。目前处理的语言只是英文和中文。感觉这个领域很难,除了统计以外,对计算机还有语言学的要求也很高,不过我还是挺感兴趣的,希望可以坚持做下去。

4. 你常用什么模型以及软件?

用赵本山的一句话来回答这个问题,那就是 “都学杂了”。遇到什么数据,需要解决什么问题,就找一下合适的模型和软件。总的来说消费者行为研究常用的统计模型(重复购买模型、随机系数模型、离散选择模型、贝叶斯模型、结构方程模型)以及机器学习的一些模型(lasso, boosting, SVM)用的稍多一些。以前常用 SAS 和 GAUSS,现在用 R 和 Matlab 多一些,也稍微学了一点 Python。

5. (选答)牛排你通常要几分熟的?

七八分吧。

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

← COS 每周精选: 如何用数据讲故事? LDA-math-LDA 文本建模 →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK