98

GitHub - YouChouNoBB/2018-tencent-ad-competition-baseline: 2018腾讯广告算法大赛b...

 6 years ago
source link: https://github.com/YouChouNoBB/2018-tencent-ad-competition-baseline
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

readme.md

项目介绍

  • 2018腾讯广告大赛baseline 100行代码带你上0.73 Image text

  • baseline 在内存大于32g的情况下使用,挑整参数,可以上0.74

  • 1.首先处理4个G的用户特征

  • 2.拼接用户特征,广告特征

  • 3.将单取值的离散特征使用稀疏方式one-hot

  • 4.将多取值的离散特征使用稀疏方式向量化

  • 5.线下测试

  • 6.线上提交

  • baseline_v2 16g左右内存使用,建议开启虚拟内存
  • 将训练集分片,分别训练预测,然后将预测结果求平均,大概需要15g内存
  • baseline_v3 只要能读进去数据,join完应该就能跑了
  • 每次训练重新读取的数据,这样应该8g内存就能跑了

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK