• 回答数

    3

  • 浏览数

    306

老余popopxm
首页 > 论文发表 > kaggle比赛论文发表

3个回答 默认排序
  • 默认排序
  • 按时间排序

美味童鞋

已采纳

kaggle比赛含金量在业界是很高的。有兴趣的可以试着参加一下,提升自己能力的同时又可以开拓视野,不断向许多强者学习。

所以不论你是求职者还是学生,如果对数据科学感兴趣,都可以利用Kaggle来锻炼自己的技能,提升自己的背景。简历中如果有这样一份为“准东家”定制的Kaggle项目经历,定能提升梦校、大厂Offer的命中率。

所以不论你是求职者还是学生,如果对数据科学感兴趣,都可以利用Kaggle来锻炼自己的技能,提升自己的背景。简历中如果有这样一份为“准东家”定制的Kaggle项目经历,定能提升梦校、大厂Offer的命中率。

181 评论

人到中年156

参加过几次,只拿过几个前10%。

下面是我的一些个人经验:

1. 一定做Ensemble,甚至是对submissions做ensemble。

2. 目的如果单纯是拿好的排名,那么就找人多的比赛参加,因为那些参加人数上千的比赛里面大批僵尸参赛者,超过他们就可以进25%了。

3. 对大多数比赛来说,Feature Engineering比选用什么模型更重要

4. 多看论坛,大家会在比赛进行中讨论很多泛泛的思路,对自己可能有帮助。有时候会有人发布比较好的Beat the benchmark代码,仔细思考为什么这个模型能够work,在上面涂涂改改有时候效果更好。

5. 永远相信自己的cross validation结果,甚于public leaderboard,结束前后的榜单常常震动巨大,具体例子参见 Description - Africa Soil Property Prediction Challenge 和 Description - Higgs Boson Machine Learning Challenge6.

每次比赛最有价值的东西就是结束之后的方法分享帖,大家的方法都很不一样,挑一个说得比较全面清晰的方法,自己尝试重现一个一样或者接近的效果,然后再尝试改进它,这个过程能学到非常多东西。

231 评论

青春你还

Kaggle主要是以Data Mining的比赛为主,那么这个答案就非常直接了:Feature Engineering无数经验告诉我们,做Kaggle比赛如果是抱着Machine Learning的态度,沉迷于facny的模型而忽略数据本身,一定会死得很惨很惨!

当然,基本的ML知识还是有的。在比赛中,最常用的分类器一般是Gradient Boosting Tree(GBDT)和Random Forest(对,你没看错,不是那个在教科书中推Dual时让很多人痛不欲生的SVM)一些常见的预处理技巧,比如PCA,KMeans,TF/IDF,Hashing等等都还是必须的。这里就不展开讲了。

最后,但是非常关键的一点是Ensemble 从KDD Cup到Imagenet,我从来没见过ensemble不会改善结果的情况,只是多与少的问题。不做ensemble就意味着你自己告别了一大块宝藏。

204 评论

相关问答

  • 论文比赛算发表吗

    你参加的是哪的比赛?说清楚点!自己写的论文是可以发表的!你放心的发吧!!

    我们的季节e 4人参与回答 2023-12-09
  • 大创比赛论文发表

    可以。大创的论文可以发表在学校电脑校园期刊里面,也可以选择核心期刊或省级国家级普刊发表都可以。

    小麻烦ly 5人参与回答 2023-12-11
  • 比赛论文发表

    论文参加比赛当然不会影响发表。反而会促进你的发表成功率。如果你的认为在比赛当中被评定为优质获得奖项。那么你的发表就更加的顺理成章了。

    我是基里连科 4人参与回答 2023-12-08
  • 未发表论文投比赛

    一般情况下是不可以的,因为没有出结果的情况下你这算是一稿多投。如果你投在其他诸如公众号之类的,那它投稿要求就是必须没有在任何地方发表过的

    浅葱de琴 4人参与回答 2023-12-06
  • 论文发表比赛

    只要是自己写的,参加比赛不重要,除非被比赛举办方拿去编辑成册并公开出版,一般情况下都可以发表在公开期刊上。发表过的论文嘛,要看比赛要求了。有的要求原创,有的要求

    小也安安 4人参与回答 2023-12-11