计算机

当前位置:澳门新葡亰官网app > 计算机 > 17岁!Kaggle史上最年轻Grandmaster诞生:高中自学

17岁!Kaggle史上最年轻Grandmaster诞生:高中自学

来源:未知 作者:澳门新葡亰官网app 时间:2019-01-09 00:12

  原标题:17岁!Kaggle史上最年轻Grandmaster诞生:高中自学3年登顶

  【新智元导读】Kaggle刚刚诞生了史上最年轻的Grandmaster,今年17岁的英国高中生Mikel Bober-Irizar。他的学校并没有AI和机器学习相关课程,全部知识都是从网上自学而来。Kaggle成立8年,注册用户超过100万,现仅有122名Grandmaster,Mikel自学三年达此成就,后生可畏,但也鼓舞人心,只要你愿意,网络自学也能成为Kaggle顶级玩家。

  在AI和大数据圈的人,应该没有不知道Kaggle的,这是全球首屈一指的数据科学、机器学习竞赛和分享平台。去年被谷歌收购时还一度引发业界轰动。企业和研究者可以在Kaggle平台发布数据、举行/参加竞赛,通过“众包”的形式产生最好的模型。现在注册用户数量超过100万。

  除了代表你参加过很多竞赛并且多次获得冠军,这个头衔在投简历找工作时也很具吸引力。同时,参加大企业举办的大型竞赛,还能获得奖金。

  目前,Kaggle在全球范围内只有122位Grandmaster,目前排名第一的是一位8年前加入的用户。

  Mikel在122位Grandmaster中,排名第31,他用的时间是3年,更重要的是,他的AI和机器学习知识全靠搜索网络资料,自学而成。

  在Kaggle,要成为Grandmaster非常困难,该头衔是根据Kaggle Progression System来判定的。它是一套用户的等级排名系统,类似于在游戏中做任务,一路打怪、攒经验,换取累计积分,达到一定要求之后就可以升级。

  在上述基础上,还需达成:添加用户的简历、定位、职业、组织;SMS确认账户;运行一个、实现一个完整的submission、评论一次以及投一次票,就可以成为Contributor。

  若用户已经在一个或多个专业类别中完成了大量关于Kaggle的工作,一旦达到某个类别的专家水平,该用户便可进入Kaggle Expert排名。

  而最顶级的Grandmaster,需要达成如下目标,也就名副其实是某个专业领域中的“顶级大师”。

  可见,达成Grandmaster目标成就的要求门槛还是相当之高,那么我们来看看这位17岁神奇boy达成了怎么的成就:

  可以看到,Mikel Bober-Irizar小选手总共获得过6枚金牌,其中5枚团战金牌,1枚Solo金牌。

  不仅如此,这位小选手总共参加了57次竞赛,其中单人Solo共计47场(82%),团队比赛共计10场(18%)。可见Mikel Bober-Irizar是一个团战、单人多方面发展的强悍型种子选手。

  纵览Kaggle Competitions排行榜,许多Grandmaster的成就是要远高于这个英国小男孩儿的,有甚者金牌数量已经达到41枚之多。

  但重点在于,Mikel Bober-Irizar只有17岁,从资料中也可以看到,他于三年前加入Kaggle,也就是说,他开始玩儿编程、参加比赛是在14岁,甚至是更早!

  Mikel Bober-Irizar不仅天赋异禀,更重要的是勤奋也是异于常人。

  从上述的数据来看,三年来,小男孩儿平均每年参加比赛的次数为19场,工作量可以说是相当的充足。反过来看,当今很多大学生,一年是否能够达到这样的工作量呢?

  而最近神奇少年们的新闻最近也是层出不穷:从18岁少年被谷歌录用、到12岁小女孩儿编写元胞自动机程序,现在Python都已经进入小学课程了。

  在Mikel的LinkedIn主页上公开数据显示,Mikel Bober-Irizar 就读于英国吉尔福德的皇家文理学校(Royal Grammar School, Guildford),从高中时期起就开始活跃参与机器学习和自动驾驶技术的软硬件研发,曾在硅谷自动驾驶出租车企业Voyage任职,后在英国EduNow负责后端和服务器开发。

  他是首批获得Udacity自动驾驶车工程师纳米学位认证的500人之一,该学位申请人达11000多人,入选率不足5%。

  尽管只有17岁,但Mikel现在已经是三菱电机研究实验室(MERL)的计算机视觉研发实习生,主要研究图像合成和表示学习。此前还担任EduNow公司的技术主管,这是一家做课程复习资料、论文查询和学习笔记服务的公司。

  首批500名(申请人11000名)获得该机构自动驾驶车工程师微学位(Nanodegree)的人,被邀请担任该课程5位学生领袖之一。

  本次比赛对参赛者提供查询图像,对于每个查询,期望检索到数据库中包含相同地标(如果有的话)的所有图像。

  比赛使用的新数据集是全球最大的图像检索研究数据集,包含超过100万张独特地标的图像。图像检索是计算机视觉中的一个基本问题,对于包含地标建筑的查询图像尤为重要,因为人们喜欢拍摄的照片中大部分都包括这些地标。

  此次挑战赛与“地标识别挑战赛”(这个竞赛Mikel在483人中排第33名,Top 7%)一道进行。两个挑战赛的使用的测试集是相同的,鼓励更多的选手参与竞争。不过,两个挑战的训练集/检索集之间没有共同的地标。

  Avito是全球规模最大、发展最快的在线分类广告商之一,这个竞赛要求Kaggle参赛者开发一个可以自动识别重复广告的模型。由于竞争激烈,卖家经常绞尽脑汁,努力让他们的产品受到关注,这可能意味着要多次发布相同的广告,对广告文字进行略微修改,或放上从不同角度拍摄的商品照片。通过更准确的重复广告检测,Avito将让买家更容易找到诚实的卖家,与之进行下一次交易。

  在本次挑战赛中,博世要求参赛者利用数千次测量和测试,预测机器的内部故障,这些测量和测试是针对生产线上的每个部件进行的。这将使博世能够以最低的成本为最终用户提供优质产品。

  竞赛使用的都是博世在其装配过程中每一步的真实记录数据,因此能利用高级分析来改进这些制造流程。不过,数据的复杂性和生产线的复杂性给当前的方法带来了问题。

  2017年7月,Mikel在接受采访时表示,他最初只是抱着试试的态度来参加Kaggle挑战赛的。从实际应用的角度讲,对算法的工作原理的理解要比其数学原理更重要。他所在的高中皇家文理学校并未设置AI和机器学习的系统课程,Mikel在机器学习和人工智能方面的编程技能几乎完全是自学成才。

  “网上有很多免费课程,但我实际上并没有参加这些课程。当我遇到一个很大的问题想解决时,我只想在谷歌上搜到这个问题。我在网上看到了Kaggle,我就想,为什么不试试呢?“

  “我不知道算法背后的所有数学原理,但就实际使用而言,我认为对算法的工作方式有一个合理的理解更为重要。即使我不能从头开始写算法,我仍然知道它具体做了什么,这有助于我理解算法可能有用的地方。”

  Mikel在Medium上也比较活跃,今年初,新智元还报道过他关于CPU漏洞的评测文章:【最大降40%】CPU漏洞补丁对机器学习和深度学习性能影响实测

  【最后一天】新智元AI Era创新产品入围名单和创新人物入围名单进入读者票选和专家评选环节,今天是投票最后一天!

本文由澳门新葡亰官网app发布,转载请注明出处:17岁!Kaggle史上最年轻Grandmaster诞生:高中自学