5

顶会paper越来越多,我该怎么看?

 3 years ago
source link: https://zhuanlan.zhihu.com/p/315760425
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

顶会paper越来越多,仅最近公布出来的NeurIPS 2020就有1900篇,试问谁能看的过来?

而由于疫情原因,绝大多数会议都选择在线上召开。作者们也为大家贴心地准备了每篇paper的video,几分钟到十几分钟。

讲故事的能力很重要

最近一段时间,听了几场顶会的talk,很明显的感觉是现在的顶会paper中 讲故事的能力 越来越重要了。

本来贡献不大,就是 a+b/a for b 模式,落到普通人手里估计也就能中个二流会议, 然而讲故事高手却能让他轻松中顶会 。真的不太容易区分出真正的贡献。

硬核的、原创的、真正有用的研究越来越少。

而谁最会讲故事呢?当然是大组和牛组。所以说普通人发文章越来越难啦。

另外建议大家不要被talk迷惑,还是要自己先看看paper。当然也不是说所有的talk对应的paper都不好,只是从好的talk里找到好的paper,还需要仔细鉴别。

不然你没看paper直接听,每个讲者都能让你觉得他做出了前无古人的工作,直接影响你的判断,让你对这个内卷的学术圈更加绝望。

而真实的情况是,绝大多数paper都只是前进了一小步,离解决真正的问题还差的很远。所以任何一个领域永远不可能被做完。

我的看法: 除非做的是理论和新架构,否则机器学习和AI相关的方法paper,归根到底没有新方法,都是已有方法的应用。所以一篇paper的贡献就是围绕为什么要用这个、以及用这个到底解决没解决问题。

所以从方法层面一个工作根本区分不出来是长期在一个领域的博士硕士做出来的,还是刚进实验室、给idea就做的本科生做出来的。 因为归根到底大家都在做机器学习的应用。 而这个时候,讲故事的能力就体现出来了。

没有一篇paper是完美的,想拒它总能找到一万个理由。想接受它也能找到一万个理由。

一篇好的工作应该是什么样的?

个人浅见,一篇好的工作至少要满足以下几个条件之一:

  1. 非常好的想法 ,可能并不难,但是不告诉你你就永远想不到。经典例子是ResNet。Skip connection非常简单,但是想到加skip connection却很难。
  2. 非常solid的工程实现和绝佳的性能。 经典例子是Transformer和BERT。自监督和无监督预训练并不是什么新的idea,但是到了Google这帮厉害的程序员手里就可以利用大规模数据和分布式训练,硬生生搞出前无古人的性能。
  3. 非常充分的理论证明。 从理论角度分析一个领域的某个问题,直接给未来工作以启示。经典例子是迁移学习领域的著名理论工作Analysis of representations for domain adaptation,后续该领域所有的理论工作都会引这篇文章。
  4. 非常solid的实验。 从实验角度分析领域的若干问题并给出相应的结论。显然在深度学习时代这种文章太重要了。经典例子是迁移学习领域2014年的文章How transferrable are features in deep neural networks。
  5. 提出一个新问题。 这个很好理解,开疆拓土式的工作当然值得一看。只是在这个paper爆炸的时代可能越来越难以鉴别到底是不是first work了。审稿人不可能看过一个领域内所有方向的paper,这时候鸡贼的投稿人就欺负审稿人没看过然后说自己是一个新问题。审稿这种paper我的原则是狠狠打死,strong reject,然后把前人的工作甩给他。并且,随便捏造一个不存在的setting就说是新问题的paper,手段也是非常高明的。
  6. 已有问题下直接开创一个新的分支。 这就厉害了,属于另起炉灶的工作。经典例子如MAML、GAN、Flow模型,完全是在开辟一个崭新的(灌水)方向。

如何看海量paper?

这个问题没有标准答案。事实上每个人不可能对所有的“好”paper都达到100%的召回率。我的方式也还是比较老套,就是顶会放榜后人工去筛出自己感兴趣的paper下载下来打上标签(用zotero)留着慢慢看。尽量用一句话总结出一篇paper的贡献。这时候就能很轻松地分辨出一篇paper是不是水文了:

如果你能轻而易举地用一句话概括它的所有贡献、并且别人能看明白或者你一个月后看到笔记你就能明白,那它多半不是一个好的工作。

如果你自己都觉得需要多做一些笔记,那这篇paper是值得一看的。

记录什么最重要? 研究的问题和它的motivation 。不然你很容易被写作的套路所迷惑。解决方案通常没有新的,都是已有方式的改进或直接应用。重点是它的用法、为什么要用、你觉得这么用是不是灌水、让你想你能不能想到。如果你也能轻松想到,那么多半它不是一个好的paper。

可能是一个新奇的看paper角度:看工业界的paper

其实 工业界的paper相对来说“好”paper的召回率能有所保证。 为啥?因为发paper是学校和研究所的kpi,那当然大家会拼命发呀。但是只会发paper在公司里是不可能混的好的。所以工业界提交的paper里总会有一部分真正能work的paper才能保证这群人能在公司里混的好。

另一方面,深度学习时代最重要就是大数据和计算平台,这两个恰恰是工业界具备的、绝大多数高校和研究所不具备的。工业界因为有实际问题和实际的数据,往往看问题会比高校和学术界更实际也更透彻、更能解决痛点。所以这个角度是不是很新奇。。。当然问题没有绝对的,我从来没说高校和研究所的paper都不好,工业界的都好,毕竟高校和学术界是工业界研究的支持力量。我在这里只是给大家提供这个角度供参考。

我们怎么学习?

从讲故事讲的好的paper里,学习讲故事的能力。

再强调一下,讲故事和写作能力在顶会里越来越重要了。不是大牛组的同学一定要加强,多读别人的paper学习套路,能加理论就加一下(虽然你也不会用到)、参考别人的用词和套路、画的精美的插图和表格,更好地包装自己。

当然,科研的本质不是做出真正改变世界的成果吗,为什么我们一直在强调讲故事和写作?悲哀啊。

从硬核的你觉得的好paper里,学习研究问题、分析问题、解决问题的能力。

这就见仁见智了,得是一个持续学习的过程,你需要自己真正进入一个领域去思考问题。

当然,并不是鼓励大家去灌水,为了毕业也是不得已。这是从写作者的角度讲大家要给予理解。毕竟没有人生来就能做出好的工作,都得慢慢成长。但绝对不要长期灌水,否则就太没有意义了,浪费电浪费GPU污染环境。所有的好工作也是建立在无数的平庸的工作基础之上的。要辩证地看待这个问题。

补充一句,顶会还是顶会,真正的好paper永远都会优先投在会议上,只是我们需要去发现它。并不是说因为灌水的多了,顶会就不“顶”了。态度还是要端正的。

最后,大家加油吧!祝每一份努力都不会白费!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK