“为啥Kaggle奖金那么少?”一场25000美元的比赛,却因“抠门”引发激烈讨论
原标题:“为啥Kaggle奖金那么少?”一场25000美元的比赛,却因“抠门”引发激烈讨论
车栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
△要啥自行车 (误)
“奖金怎么这么少?”
网约车的翘楚Lyft,刚刚在Kaggle上启动了一场针对自动驾驶的3D目标检测比赛,奖金池25,000美元,约合17.7万人民币。
谷歌进行中的Youtube-8M视频理解比赛,也是一样。仿佛这就是Kaggle比赛的标配。
不过,Reddit论坛上有人发问了:
为何Kaggle比赛的奖金如此之低?
一个比现有方法表现都好的模型,应该能带来巨大的价值。
为什么这些办比赛的公司,在奖金上面这么抠?
问题发表之后,许多小伙伴都有话要说,一日之间热度已经超过了300。
多少才是多
所以,奖金池25,000美元,第一名12,000美元,很少么?
如果和Netflix Prize(网飞奖) 这样的大奖赛相比,的确是这样了。
那是2006年,Netflix用100万美元悬赏一个算法,预测用户对电影的评分:只要比公司自己的Cinamatch算法提升10%,就能得到这百万奖金。
为此,Netflix还隆重发布了一个数据集,里面有上亿次评分,是480,189位用户,为17,700部电影做的评价。每个数据点,都是由用户编号、电影名、评分时间以及评分,这四个数字组成。
这在当年的推荐算法界,成为了标志性事件。
2009年,奖金终被一个叫做BellKor’s Pragmatic Chaos的团队抱走,他们开发的算法,比Netflix当时在用的系统,提升了10.06%。
如今,虽然Netflix的主要业务,已经从DVD租赁变成了网络视频付费服务,但推荐算法依然是从当年比赛的算法上,改进而来的。
△下面一排排,就是推荐算法的作品
讲完这些,再回头看Reddit网友的问题描述:
“比当前算法更好的模型,应该有巨大价值。”“办Kaggle比赛的公司怎么那么抠?”,这样的说法好像都变得有的放矢。
不过,世间的比赛那么多,其中的意义也不能一概而论。
大家怎么说
Reddit顶楼的网友 (@htrp) 说:
比起网飞奖 (Netflix Prize) 这样的大奖赛,公司办Kaggle比赛,更像是一种招揽人才的方式。
这样的比赛,大概也不会把原始的、真实的数据交给你。
换句话说,假如主要目的不在于改进自家的算法,又不会用真实数据来评定参赛的算法,也就不太可能下重金去刺激大家做出惊天动地的成就。
关于这一点,网友 (@crashbe4youcouldsave) 做了补充:
Kaggle比赛的优胜算法,是会公开代码的。主办公司没办法从比赛上获得什么技术优势,因为竞争对手也同样可以拿到代码。
要说技术价值,比起从优胜算法里挖掘,可能从kernels和论坛上小伙伴的讨论里,还能找到更多新的思路。
那么,没有百万美金激励的Kaggle比赛,选手们上传的模型,是不是也能产生“巨大的价值”?
不,许多网友并不这样想,他们各有各的理由。
有人 (@mimighost) 认为:
参赛的方案,主办方可能会看一看,从里面获得一些灵感,但不可能直接用到生产线上去。还有延时、成本等等各种因素需要考虑。
从排行榜的第一名,到工业界能够交付的成果之间,通常有很长一段路要走。
不过,如果抛开不可交付的问题,针对参赛算法本身的价值,大家又怎样看呢?
有人(@probablyuntrue) 感觉:
可能很多结果,都是调参调出来比别人高0.1%吧。
如果,获奖和没获奖的算法,未必是天壤之别,获奖的算法也未必有超乎寻常的成就,在这样的期待之下,也很难有更高的奖金安排。
更加极端的说法 (@Deto) 是:
玩Kaggle,大家不都是拿一样的模型套各种比赛的么?
大概也是想要说明,Kaggle比赛不值得再高的激励了。
当然,这位胖友的发言,受到了众人的强烈反对。
还有人把ta的看法,和那些“我擅长ML + 我Kaggle成绩不好 = Kaggle不反映ML能力”的选手联系在一起。
一块钱也参加
在许多人眼里,Kaggle比赛奖金的确不算多,且基于种种原因也不太可能更高了。
但从字里行间看,人们也没有因为这些,就忽略Kaggle比赛存在的价值。
不论是奖金、工作机会,还是在论坛上与人交流之后,收获的改进算法的灵感,都可能成为继续参加比赛的理由。
“觉得钱少不要参加,反正很多人想参加。”
“就算奖金1块钱,我也愿意参加。”
最后的最后,不要忘了起初引发讨论的,是Lyft刚刚开启的目标检测比赛。这一场比赛为什么奖金不多呢?
我来告诉你他们为什么没在上面投好多钱,因为他们没有钱。
(这句话来自@sroberts928,零票答案,谨慎参考。)
— 完—
大会启幕!预见智能科技新未来
量子位MEET 2020智能未来大会启幕,将携手优秀AI企业、杰出科研人员呈现一场高质量行业盛会!详情可点击图片:
榜单征集!三大奖项,锁定AI Top玩家
2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
相关文章
-
“区块链”+“物联网”成天作之合?12大落地场景解密【附下载】|智东西内参
-
在友商的“鞭策”下那个玩“饥饿营销”的小米不复存在了?
-
在特殊时期,我们正在远离手机更多拥抱PC
-
熊猫直播是怎么凉的?
-
WhatsApp可能会在今年推出加密货币
-
SEM竞价的三个细节和技巧
-
情人节变“情人劫”,这款APP让无数情侣上当受骗!
-
又一暴利行业兴起?内行人:当下看不起,以后想进或来不及
-
严阵以待readyornot登不上/延迟太高/卡顿掉线解决方法
-
个人防护是否到位?看图自查→
-
阿里巴巴:打造全数字化供应链网络,未来面向全行业开放
-
华为开发者学院|卷积神经网络与图像处理,听这一节课就够了
-
华为P40系列DxOMark跑分曝光,无愧拍照之王
-
解决畜牧管理难题,中农智联智能耳标场景化应用这样做
-
坐困愁城的罗永浩,春风得意的罗振宇
-
亚马逊和微软如何出招解决网络安全?
-
“一日不斗,我浑身难受”,表情包斗图成瘾下的大市场
-
新漫评:美国情报机构能力值有多强?真能搞好溯源?
-
为何美国大型企业正在陷入一场高级人才用工荒?
-
【钛晨报】格力股权转让获正式批复;2020年中国5G投资将达9000亿元,2025年5G渗透率达48%
-
让全世界大厂都手忙脚乱的代码漏洞,是怎么一步步成为噩梦的?
-
思考|经验共享模式是指什么?
-
下一代互联网社区,离我们还有多远?
-
摩托罗拉经典款手机要出折叠屏,联想开始卖情怀了?
-
咕咚和Keep,谁才是国内的Peloton?
-
美国又抛“中国内存芯片威胁论” ,对福建晋华实施出口限制
-
浅谈Linux高负载的系统化分析浅谈Linux高负载的系统化分析
-
vivo有了IQOO OPPO也要在国内重启Realme?
-
虎牙CEO董荣杰:月活超1亿,将筹建电竞公司