二分类、多分类、回归任务,一个项目get竞赛必备模型
source link: https://www.jiqizhixin.com/articles/2020-11-29-4
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
数据科学竞赛是学习各类算法、深入理解数据科学、提升和挑战自己的绝佳机会,而这些竞赛中有一些常用的模型。
近日,有开发者在 GitHub 上开源了一个包含数据挖掘类比赛常用模型的项目,主要涵盖二分类、多分类以及回归任务。项目代码全部使用 Python 实现。
项目地址:https://github.com/QLMX/data_mining_models
该项目包含二分类模型、多分类模型以及回归模型,它们分别基于 lightgbm 实现、xgboost 实现、keras 实现和 pytorch 实现:
lightgbm
-
binary_class.py :lightgbm 实现的二分类
-
multi_class.py :lightgbm 实现的多分类
-
regression.py :lightgbm 实现的回归
-
multi_class_custom_feval.py :lightgbm 自定义评价函数实现多分类
-
multi_class_weight_loss.py :lightgbm 多类别不平衡问题,实现类别加权优化
xgboost
-
binary_class.py :xgboost 实现的二分类
-
multi_class.py :xgboost 实现的多分类
-
regression.py :xgboost 实现的回归
keras 实现的 mlp
-
binary_class.py :keras 实现的 mlp,做二分类任务
-
multi_class.py :keras 实现的 mlp,做多分类任务
-
regression.py :keras 实现的 mlp,做回归任务
pytorch 实现的 mlp
-
binary_class.py :pytorch 实现的 mlp,做二分类任务
-
multi_class.py :pytorch 实现的 mlp,做多分类任务
-
regression.py :实现的 mlp,做回归任务
环境设置
可以直接通过 pip install -r requirements.txt 安装指定的函数包,具体的函数包如下:
<code>pandas</code> <code>numpy</code> <code>matplotlib</code> <code>sklearn</code> <code>tensorflow==1.12.0</code> <code>keras==2.2.4</code> <code>pytorch</code> <code>seaborn</code> <code>lightgbm==2.2.1</code> <code>xgboost==0.90</code>
项目解读
第一部分 lightgbm 的数据是基于拍拍贷比赛截取的一部分特征,随机选择了 5000 个训练数据,3000 个测试数据。针对其中 gender、cell_province 等类别特征,直接进行重新编码处理。
第二部分又基于 xgboost 实现了二分类、多分类和回归任务。
第三、四部分是深度网络部分,是基于 keras 实现的多层感知机网络 (mlp)。pytorch 主要用于图像处理任务,在数据挖掘类比赛中很少用到,但该项目整理了基于 pytorch 实现的 mlp 做分类与回归任务代码。
项目作者对项目的各部分进行了详细的解读,具体参考以下内容:
参考链接:
https://mp.weixin.qq.com/s/t6EpWmLWP81DcJ7AUro3Ng
https://mp.weixin.qq.com/s/Td0Vrx9YO5rEn66L4C42Zw
https://mp.weixin.qq.com/s/XaB1BsLL_Va7dGL0S0rUOQ
https://zhuanlan.zhihu.com/p/80381974
Recommend
-
5
本文是 机器学习...
-
2
【TensorFlow案例1】回归和分类 2018年09月13日 Author: Guofei 文章归类: 2-3-神经网络与TF ,文章编号: 291 版权声明:本文作者是郭飞。转载随...
-
6
分类模型的性能评估——以 SAS Logistic 回归为例 (1): 混淆矩阵跑完分类模型(Logistic 回归、决策树、神经网络等),我们经常面对一大堆模型评估的报表和指标,如 Confusion Matrix、ROC、Lift、Gini、K-S 之类(这个单子可以列很长),往往让很多在业务中需要...
-
8
分类模型的性能评估——以 SAS Logistic 回归为例 (2): ROC 和 AUC上回我们提到,ROC 曲线就是不同的阈值下,以下两个变量的组合(如果对 Sensitivity 和 Sp...
-
5
分类模型的性能评估——以 SAS Logistic 回归为例 (3): Lift 和 Gain书接前文。跟 ROC 类似,Lift(提升)和 Gain(增益)也一样能简单地从
-
3
机器学习(二)——分类与逻辑回归 2016-08-02 LMS算法(续) 一些研究认为大Batch训练有可能无法达到最小值。 https://mp.weixin.qq...
-
1
跨界之阿尔滋海默病的分类竞赛几周前受小王萌的邀请,参加了天津大学医学部组织的一场关于利用DTI影像进行阿尔滋海默病的分类竞赛,结果虽然只得了第四...
-
2
回归测试的分类 原创 多测师11 2022-07-07 10:09:06...
-
3
回归与分类 机器学习的主要任务便是聚焦于两个问题:回归与分类 回归与分类 回归的定义 机器学习的过程就是寻找函数的过程,通过训练获得一...
-
2
时间记录和记账、记笔记颇有相似之处,它们都被期待成为增强自我觉察的人生复盘之锚,同时也都隐含着对自觉自律的严格要求。简单来说就是,使用之前壮志踌躇、满怀美好想象,使用之后发现都坚持不下来。因为记录太难了试想一个这样...
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK