今天向各人介绍一下Kaggle,觉得上面其实是太好玩了。。。所以必然要安利,安利,安利(重要的工作说三遍)
Kaggle是一个数据建模和数据阐发竞赛平台。企业和研究者可在其上发布数据,统计学者和数据发掘专家可在其长进行竞赛以产生更好的模子。那一寡包形式依赖于那一事实,即有浩瀚战略能够用于处理几乎所有预测建模的问题,而研究者不成能在一起头就领会什么办法关于特定问题是最为有效的。Kaggle的目的则是试图通过寡包的形式来处理那一难题,进而使数据科学成为一场运动。2017年3月8日谷歌官方博客颁布发表收买Kaggle。
Kaggle 的官网网站:
Competitions | Kagglewww.kaggle.com/competitionsSlogan: Making Data Science a Sport
Kaggle中组织一场竞赛的过程如下。
竞赛主持人筹办数据和问题的描述。Kaggle对那一过程以及竞赛的建构、数据的匿名化以及集成最末获胜的模子供给征询办事。参与者通过差别的办法停止尝试,彼此竞赛以获得更优的模子。关于大大都的参与者,他们的提交会按照预测精度被立即评分,并在实时的积分榜上显示。在截行时间事后,竞赛主持报酬“全球性的,永久性的,不成撤销和免版税地利用获奖做品”付出奖金。亦即竞赛获胜者的算法、软件和相关的常识产权长短排他性的,除非出格指明。除了公开竞赛以外,Kaggle还向活泼参与者供给暗里的角逐,以及为大学团体供给Kaggle-in-Class项目。
按照Kaggle官方供给的数据,Kaggle在全球范畴内拥有将近20万名数据科学家,专业范畴从计算机科学到统计学、经济学和数学。Kaggle也曾经和NASA、维基百科、德勤和功德达合做举办竞赛。此中的一项奖项高达300万美金的竞赛是Heritage Health Prize,目标是通过病人看病及吃药住院等数据预测明年病人住院的天数。另一项与微软合做的竞赛则旨在进步Kinect的手势识别精度。
Kaggle的竞赛在艾滋病研究、棋牌评级和交通预测方面获得了功效。基于那些功效产生了一系列的学术论文。产生那一成果的原因是实时积分榜促使参与者不竭改良以试图超越当前的更佳理论。获胜的办法常常在Kaggle的博客No Free Hunch上展现。
目前的话,我正在看那位大神DanB | Kaggle的文章,觉得写的很通俗易懂。是不是看着很心爱,哈哈哈
有兴趣的也能够参考@a2Mia姐的答复
1. Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾 英文教程:An Interactive Data Science Tutorial2. House Prices: Advanced Regression Techniques(房价预测)
中文教程:Kaggle竞赛 — 2017年房价预测 英文教程:How to get to TOP 25% with Simple Model using sklearn3. Digital Recognition(数字识别)
中文教程:大数据竞赛平台—Kaggle 入门 英文教程:Interactive Intro to Dimensionality Reduction我包管你不会懊悔的。