发布日期:2025-05-13 05:27 点击次数:57
要说这一轮 AI 海浪中的最大赢家,彰着非英伟达莫属。自 2022 年年末 OpenAI 发布 ChatGPT 以来,英伟达的市值就高潮了近 5 倍,甚而突出苹果成为了人人最值钱的公司。眼看着英伟达如今大致让 OpenAI、Meta、xAI 等一众 AI 厂商列队交钱,也就使得越来越多的公司想成为这次 AI 淘金热中的"卖水东谈主"。
但由于英伟达的 GPU 以及 CUDA 生态护城河太深,就连老敌手 AMD 都难以跳跃,是以平直抢英伟达的交易无疑难如登天,因此更多的厂商就盯上了 AI 产业链的其他要领。日前以分享出行盛名的 Uber 方面晓谕,将面向外部通达原仅供里面使用的 Scaled Solotions 东谈主工数据标注服务。
与此同期有音尘源线路,Uber 本月在好意思国、加拿大、印度、波兰、尼加拉瓜等国与零丁承包商签约,将通过承包商来为当地提供来自 Scaled Solotions 的付费东谈主工数据标注任务。不言而喻,Uber 方面这是准备动作"总包",在人人鸿沟内组织一支数字零工军队、来挑升从事数据标注。
事实上,数据标注是将千般图片、文本、视频等数据集打上标签,是其成为二进制打算机不错矫捷、识别的使命,此前这个使命在 2007 年主如果由圭臬员来认真完成。但是将金贵的圭臬员用于数据标注无异于煮鹤焚琴,以至于开导在大数据基础上的深度学习在 2007 年之前一直都弗成抖擞。
而数据标注的变革发生在 2007 年,打算机科学家李飞飞在这一年创建了 ImageNet 数据集,并通过亚马逊众包平台雇佣了 167 个国度所有 5 万东谈主,来给 10 亿张图片筛选、排序、打标签。ImageNet 的出现也记号着 AI 行业转向了由数据运行的范式,深度学习也由此成为 AI 行业的显学。
ImageNet 的成效之处就在于镇静了圭臬员,使得完成了基础教化的任何东谈主都不错承担数字标注这个使命。事实上,数据标注并不复杂,比如给定一张图片,让你来标出图片中的行东谈主、车辆、建筑等元素,或是给一段语音要求你判断谈话东谈主的口吻,这种使命基本完成了九年义务教化的东谈主都能简易胜任。
也正是因为门槛低,是以从某种深嗜上来说,数字标注从业者的使命是对着电脑屏幕、确认 AI 开导者给定的功令为数据打上千般各样的标注,与活水线上工东谈骨干的活没什么分离,属于相当典型的"赛博搬砖"。尽管"赛博搬砖"看起来与充满科技感的 AI 扞格难入,但确乎很赢利。
就在本年夏令,专注于为 AI 厂商提供数据标注服务的 Scale AI,完成了由硅谷顶级基金 Accel 领投的 F 轮融资,估值达到了 138 亿好意思元。而这家公司的一长串投资者更是星光熠熠,其中包括英伟达、亚马逊、Meta、AMD、高通、想科、英特尔。要知谈,如今与 OpenAI 王人名的 Anthropic 的估值也独一 180 亿好意思元,是以给 AI 厂商"打杂"的 Scale AI 其实要远比外界瞎想的更有前程。
数据标注很赢利的原因也很浅薄,因为在现存工夫条目下,它不是第二产业、而是第三产业。尽管市面上确乎有 Doccano、SuperAnnotate 等自动化器具,但 AI 大模子锻真金不怕火需要的高质料、高精度数据,这些自动化器具有劲未逮,是以只可依靠东谈主工。那么问题就来了,既然 Scale AI 的珠玉在前,又为何独一 Uber 跟风,其他互联网大厂如何莫得行径起来呢?
尽管数据标注确乎莫得工夫门槛,只消想作念,从 OpenAI 到 Meta、再到谷歌,这些大厂开导数据标注业务线可谓是触手可及。但恰正是因为数据标注没什么门槛,是以属于处事密集型产业,信得过的难点是数据的获取以及数据的分发,也即是从那处取得数据,再将数据标注使命分发到妥当的东谈主手里。
动作专注于分享出行和外卖的互联网大厂,Uber 手上掌捏的行车数据、地舆位置数据都特地有价值,如若否则,自动驾驶公司 Aurora Innovation、LBS AR 游戏开导商 Niantic 也就不会与 Uber 结合,使用 Scaled Solotions 的服务了。同期 Uber 又是一家跨国巨头,他们早在 2015 年就已粉饰 58 个国度和地区,时于当天更是的确无边人人。
而分享出行、外卖行业的独特性,也意味着 Uber 在人人各地都需要借助供应商来取得司机、骑手资源,在这已经由中,就势必会与各个供应商保持相关。因此借助人人各地"地头蛇"的力量,Uber 不错将数据标注作念到更高的性价比。
是以在既有资源、又相关系的情况下,Uber 的数据标注服务又怎有弗成效的道理。
【本文图片来自积累】j9九游会官方