美味童鞋
kaggle比赛含金量在业界是很高的。有兴趣的可以试着参加一下,提升自己能力的同时又可以开拓视野,不断向许多强者学习。
所以不论你是求职者还是学生,如果对数据科学感兴趣,都可以利用Kaggle来锻炼自己的技能,提升自己的背景。简历中如果有这样一份为“准东家”定制的Kaggle项目经历,定能提升梦校、大厂Offer的命中率。
所以不论你是求职者还是学生,如果对数据科学感兴趣,都可以利用Kaggle来锻炼自己的技能,提升自己的背景。简历中如果有这样一份为“准东家”定制的Kaggle项目经历,定能提升梦校、大厂Offer的命中率。
人到中年156
参加过几次,只拿过几个前10%。
下面是我的一些个人经验:
1. 一定做Ensemble,甚至是对submissions做ensemble。
2. 目的如果单纯是拿好的排名,那么就找人多的比赛参加,因为那些参加人数上千的比赛里面大批僵尸参赛者,超过他们就可以进25%了。
3. 对大多数比赛来说,Feature Engineering比选用什么模型更重要
4. 多看论坛,大家会在比赛进行中讨论很多泛泛的思路,对自己可能有帮助。有时候会有人发布比较好的Beat the benchmark代码,仔细思考为什么这个模型能够work,在上面涂涂改改有时候效果更好。
5. 永远相信自己的cross validation结果,甚于public leaderboard,结束前后的榜单常常震动巨大,具体例子参见 Description - Africa Soil Property Prediction Challenge 和 Description - Higgs Boson Machine Learning Challenge6.
每次比赛最有价值的东西就是结束之后的方法分享帖,大家的方法都很不一样,挑一个说得比较全面清晰的方法,自己尝试重现一个一样或者接近的效果,然后再尝试改进它,这个过程能学到非常多东西。
青春你还
Kaggle主要是以Data Mining的比赛为主,那么这个答案就非常直接了:Feature Engineering无数经验告诉我们,做Kaggle比赛如果是抱着Machine Learning的态度,沉迷于facny的模型而忽略数据本身,一定会死得很惨很惨!
当然,基本的ML知识还是有的。在比赛中,最常用的分类器一般是Gradient Boosting Tree(GBDT)和Random Forest(对,你没看错,不是那个在教科书中推Dual时让很多人痛不欲生的SVM)一些常见的预处理技巧,比如PCA,KMeans,TF/IDF,Hashing等等都还是必须的。这里就不展开讲了。
最后,但是非常关键的一点是Ensemble 从KDD Cup到Imagenet,我从来没见过ensemble不会改善结果的情况,只是多与少的问题。不做ensemble就意味着你自己告别了一大块宝藏。
你参加的是哪的比赛?说清楚点!自己写的论文是可以发表的!你放心的发吧!!
可以。大创的论文可以发表在学校电脑校园期刊里面,也可以选择核心期刊或省级国家级普刊发表都可以。
论文参加比赛当然不会影响发表。反而会促进你的发表成功率。如果你的认为在比赛当中被评定为优质获得奖项。那么你的发表就更加的顺理成章了。
一般情况下是不可以的,因为没有出结果的情况下你这算是一稿多投。如果你投在其他诸如公众号之类的,那它投稿要求就是必须没有在任何地方发表过的
只要是自己写的,参加比赛不重要,除非被比赛举办方拿去编辑成册并公开出版,一般情况下都可以发表在公开期刊上。发表过的论文嘛,要看比赛要求了。有的要求原创,有的要求