论文推荐 | 谷歌β-LASSO 算法实现最强多层感知机？一种重建 NBA 球员方法，实现了新的 SOTA 性能

5个月前 ⋅ 676 ⋅ 0 ⋅ 0

内容来源：机器之心微信公众号

参与：**杜伟、楚航、罗若天**

1. Towards Learning Convolutions from Scratch

2. Reconstructing NBA Players

3. Bundle Recommendation with Graph Convolutional Networks

4.Learning to Recommend with Social Trust Ensemble

5.ArXiv Weekly Radiostation：NLP、CV、ML 更多精选论文

论文 1：Towards Learning Convolutions from Scratch

作者：Behnam Neyshabur
链接：https://arxiv.org/pdf/2007.13657.pdf

摘要：卷积是计算机视觉架构中最重要的组件。随着机器学习趋向于减少专家偏见（expert bias）以及从数据中学习，那么很自然地，接下来的一步应该是从头开始学习类似卷积的结构。然而，事实证明这并不容易。例如，当前的 SOTA 架构搜索算法使用卷积作为一种已有的模块，而不是从数据中从头开始学习。

为了理解引起卷积的归纳偏置，研究者使用最小描述长度（MDL）作为指导原则，发现在某些情况下，它确实可以说明架构的性能。

为了用小的描述长度找出架构，研究者提出了 LASSO 算法的一个简单变体 β-LASSO。将其应用于全连接网络进行图像分类任务时，它可以学习具备局部连接的架构，并且在 CIFAR-10 数据集上达到了 SOTA 准确率（85.19%），在 CIFAR-100 数据集上达到了 59.56% 的准确率，在 SVHN 上实现了 94.07% 的准确率，缩小了全连接网络和卷积网络之间的差距。

file

推荐：谷歌新研究用 LASSO 算法的变体 β-LASSO 武装 MLP，将其在 CIFAR-10 数据集上的准确率提升到 85%。

论文 2：Reconstructing NBA Players

作者：Luyang Zhu、Konstantinos Rematas、Brian Curless、Steve Seitz、Ira Kemelmacher-Shlizerman
链接：https://arxiv.org/pdf/2007.13303.pdf

摘要：近来，基于单张图像的 3D 人体姿态和形状估计取得了巨大进展，但由于人体姿态、衣服建模和人体自遮挡等多方面的影响，当前最优的人体重建结果依然存在着误差。

在文中，来自华盛顿大学的研究者提出了一种重建 NBA 球员的方法，该方法实现了新的 SOTA 性能。该研究的关键在于一种创建 NBA 球员的姿态可调且带有皮肤的模型，以及一个提取自 NBA2K19 游戏的大型网格数据集。

基于这些模型，研究者以任何投篮姿态下穿衣球员的单张图片作为输入，并输出该球员的高分辨率网格和 3D 姿态。

file

file
推荐：研究表明，该方法相较单图像的人体形态重建方法有了显著的性能提升。

论文 3：Bundle Recommendation with Graph Convolutional Networks

作者：Jianxin Chang、Chen Gao、Xiangnan He、Depeng Jin、Yong Li
链接：https://dl.acm.org/doi/pdf/10.1145/3397271.3401198

摘要：该研究针对捆绑推荐提出了一种名为 BGCN（Bundle Graph Convolutional Network，捆绑图卷积网络）的图神经网络模型。BGCN 将用户 - 物品交互、用户 - 物品组合交互和物品组合 - 物品的从属关系统一到一张异构图里。以物品节点为桥梁，用户和物品组合节点之间的图卷积传播让学得的表征能够捕获物品层面的语义。

通过基于 hard-negative 采样方法的训练，进一步区分用户对相似物品组合的细粒度偏好。该研究在两个真实数据集上进行实验，结果表明 BGCN 获得了显著的性能提升，比 SOTA 方法高出 10.77% 到 23.18%。

file

推荐：本文获得 SIGIR 2020 最佳短论文荣誉提名奖。

论文 4：Learning to Recommend with Social Trust Ensemble

作者：Hao Ma、Irwin King、Michael R. Lyu
链接：https://www.cc.gatech.edu/~zha/CSE8801/CF/p203-ma.pdf

摘要：为了更准确、更真实地建模推荐系统，该研究提出了一种新型概率因子分析框架，它可以自然地将用户及其信任朋友的喜好融合在一起。在这个框架中，研究人员还创造了一个新术语「社会信任集合（Social Trust Ensemble）」，用来表示社会信任对推荐系统的限制。

复杂性分析表明，由于该方法随着观察值数量呈线性缩放，因而它可以应用到超大规模数据集中。此外，实验结果也表明，该方法的性能优于当时的 SOTA 方法。

file
推荐：本文获得了 SIGIR 2020 时间检验奖。

ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation，在 7 Papers 的基础上，精选本周更多重要论文，包括CV领域各10篇精选，详情如下：

本周 10 篇 CV 精选论文是：

1. Perceiving 3D Human-Object Spatial Arrangements from a Single Image in the Wild. (from Deva Ramanan, Jitendra Malik)

2. Learning Video Representations from Textual Web Supervision. (from Jia Deng, Rahul Sukthankar, Cordelia Schmid)

3. Rewriting a Deep Generative Model. (from Jun-Yan Zhu, Antonio Torralba)

4. Active Learning for Video Description With Cluster-Regularized Ensemble Ranking. (from John Canny)

5. Cassandra: Detecting Trojaned Networks from Adversarial Perturbations. (from Rohit Gupta, Mubarak Shah)

6. Perpetual Motion: Generating Unbounded Human Motion. (from Yan Zhang, Michael J. Black)

7. What My Motion tells me about Your Pose: Self-Supervised Fine-Tuning of Observed Vehicle Orientation Angle. (from Tinne Tuytelaars)

8. Visual Compositional Learning for Human-Object Interaction Detection. (from Yu Qiao, Dacheng Tao)

9. The Surprising Effectiveness of Linear Unsupervised Image-to-Image Translation. (from Yair Weiss)

10. Contrastive Learning for Unpaired Image-to-Image Translation. (from Alexei A. Efros, Jun-Yan Zhu)

本文章首发在极市计算机视觉技术社区

微信公众号: 极市平台（ID: extrememart ）
每天推送最新CV干货

论文推荐 | 谷歌β-LASSO 算法实现最强多层感知机？一种重建 NBA 球员方法，实现了新的...

论文推荐 | 谷歌β-LASSO 算法实现最强多层感知机？一种重建 NBA 球员方法，实现了新的 SOTA 性能

Recommend

性能提升趋饱和，图像复原研究遇瓶颈？左旺孟：仍大有可为｜极市学者专访

避免空间压缩，解决高秩难题，港中文提出语义分割新方法：张量低秩重建｜ECCV2020

论文推荐丨轮腿两用机器人；领域知识图谱综述

大合集！2019-2020年目标跟踪资源全汇总（论文、模型代码、优秀实验室）

LeetCode 题目分类与面试问题整理

3K+Star！微软开源 Computer Vision Recipes：一套全面的开发工具与代码示例

Gated channel transformation for visual recognition

React Native Text 垂直居中问题

微信小程序-图形验证码实现

Service Worker: H5页面性能优化

About Joyk