财讯:二分类、多分类、回归任务,一个项目get竞赛必备模型
本篇文章1531字,读完约4分钟
机心报道
机器的心
数据挖掘竞赛的必备模型,四种实现方法,你值得拥有。
数据科学竞赛是学习各种算法,深入理解数据科学,提高自己,挑战的绝佳机会,这些竞赛有一点常用的模式。
最近,一位开发者在github上以包含数据挖掘类比赛常用模型的项目为开源,首先涵盖了二分类、多分类和回归任务。 项目代码全部由python实现。
项目地址: github/qlmx/data_mining_models
这个项目包括lightgbm实现、xgboost实现、keras实现、基于pytorch实现的二分类模型、多分类模型和回归模型。
lightgbm
binary_class.py :lightgbm实现的二分类
multi_class.py :lightgbm实现的多分类
regression.py :lightgbm实现的回归
multi _ class _ custom _ f eval.py:light GBM自定义评价函数实现多分类
multi _ class _ weight _ loss.py:light GBM多类不平衡问题,实现类加权优化
xg提升
binary_class.py :xgboost实现的二分类
multi_class.py :xgboost实现的多分类
regression.py :xgboost实现的回归
keras实现的mlp
binary_class.py :keras实现的mlp,二分类任务
multi_class.py :keras实现的mlp,多分类任务
regression.py :keras实现的mlp,回归任务
pytorch实现的mlp
binary_class.py :pytorch实现的mlp,二分类任务
multi_class.py :pytorch实现的mlp进行多分类任务
regression.py :实现的mlp,回归任务
环境设定
指定的函数包可以直接从pip install -r requirements.txt安装。 具体的函数包如下。
pandasnumpymatplotlibsklearntensorflow = =1. 12.0 keras = =2.2.4pytorchseabornlightgbm = =2.2. 2
项目的解读
第一部分lightgbm的数据基于音频信用比赛的部分特征,随机选择了5000个训练数据、3000个测试数据。 比较其中的gender、cell_province等类的特征,直接进行再编码解决。
第二部分在XG boost的基础上实现了二分类、多分类、回归任务。
第三、四部分是深度互联网部分,是基于keras的多层探测器互联网( mlp )。 pytorch主要用于图像解析任务,在数据挖掘类的竞赛中很少使用,但这个项目整理了基于pytorch的mlp分类和回归任务代码。
项目作者详细解读了项目的各个部分,具体参考了以下复印件。
参考链接:
MP.Weixin.QQ/S/T6 EPWMLWLWP 81 DC J7 Auro3ng
MP.Weixin.QQ/s/TD0VRX 9y O5 Ren 66 L4C 42zw
MP.Weixin.QQ/s/XAB1BSLL _ VA7DGL0S0 Ruoq
zhuanlan.zhihu/p/80381974
neurips meetup
12月6日在北京,机心举办neurips meetup。 活动设置了4个keynote、12篇论文报告和30个poster,邀请顶级专家、论文作者和现场参加者一起交流。
原标题:《二分类,多分类,回归任务,一个项目get竞赛必备模式》
阅读原文。
标题:财讯:二分类、多分类、回归任务,一个项目get竞赛必备模型
地址:http://www.mnscw.cn/syxx/12942.html
免责声明:民生财经杂志网致力于提供权威、全面、专业、及时的财经资讯,的部分内容转载于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,民生财经杂志网将予以删除。