大模型里的“数字工人”:有人日结35,有人年薪300万

频道:股市期货 日期: 浏览:37960

“快烧不起了,但年底也没有好的出路。”一家北京AI大模型明星创业公司员工李晓远告诉和讯商业。

今年2月,大模型吹来一股风,春江水暖鸭先知,原本身处互联网大厂担任产品经理岗位的李晓远感受到AGI可能有机会。4月,在看到杭州一家公司因320万年薪招聘AI专家登上微博热搜后,他决定也要搭上这趟快车。

李晓远的抉择,其实是今年大模型领域人才迭代的缩影。

在这场战役中,有人追逐大模型,有人供养大模型,亦有人不相信内里可以淘金,有产业的地方就有人和江湖,但谁也不敢肯定,这股潮水,将会将他们推向何处。

追着大模型跑的人

风起,要把时间拨回至2022下半年,随着ChatGPT这款跨时代产品的问世,类GPT项目成为AGI最大热门。上至百度、阿里等互联网大厂,下至如李晓远公司一般成立仅仅几个月的初创企业,都把研发大模型列为了业务的最高优先级。

短短一年,百度文言一心、商汤日日新等大模型相继问世,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个,正式拉开“百模大战”竞争的序幕。

在这个新赛道里,招兵买马,是每个入局玩家的焦虑和渴求。

来自脉脉高聘人才智库数据显示,今年春招期间,是大模型创业的高峰期,人才需求一度井喷。2月,AIGC新发岗位量增幅75.6%,3月持续上升,环比增幅上涨12.56%。随着春招结束和创业潮告一段落,人才需求有所回落。6月,大模型公司波澜再起,人才需求再度上扬4.16%,以算法工程师需求为主。

大模型如雨后春笋拔地而起,李晓远心情却有些复杂,入职新公司后,他依然担任产品经理,一个在互联网行业高度成熟且角色重要的职位,但职业规划远没有在大厂时清晰。“虽然薪资确实越级了,但公司甚至这个行业是否需要产品经理岗位,我不敢给定论。”

在他看来,这家公司虽然融资进展不错,但尚处于初创阶段,远没有大厂的算力和底蕴。“现阶段,还是集中在给大模型打基础,而底层的技术大拿,譬如算法人才、架构人才,那才是核心,也是市场中最被需要的一波人。”

李晓远此言非虚。一位专注于AI领域的猎头告诉和讯商业,大模型市场中处于金字塔顶尖的人,学术成果、实践经验、学历背景和创新意识缺一不可。

他介绍,从客户的需求来看,一方面,这个人需要紧跟大模型的进展,全球范围内,研究这个方向的优秀者很多,进展很快,每天或许有几百篇新论文出来,你需要在各个方向、领域做改进,最好也能贡献Paper。

另一方面,做到前沿还不够,这个人还需要沉下来,从实际需求出发,用好大模型,来解决在工程上遇到的问题,最好可以提高某些指标,才有人买单。

上游早就传导过需求。天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成就曾提到,大模型训练本质是个工程问题,实践经验非常重要。目前,昆仑万维最稀缺的是核心算法人才,除了要求候选人具备扎实的编程能力和算法基础,对业务有深入理解以外,还希望候选人拥有大模型训练实践经验以及创新能力。

和讯商业从猎聘、BOSS直聘等招聘平台发现,无论互联网大厂、AI独角兽等科技公司,还是金融、医疗等传统公司,在招聘大模型相关岗位时,很多要求“具备大模型预训练经验”、“熟悉Transformer(适用于大模型的预训练框架)”、“深入理解大模型应用场景”。

更有甚者,注明拥有“曾就职于OpenAI”、“在国际顶级核心期刊发表过大模型相关研究成果”等经验大大加分,给出的年薪也普遍超过百万,如果再加上期权等福利,可谓优厚。

vivo副总裁周围算过一笔账,现在,vivo大模型总投入成本已经超过200亿元,人才和数据算力各占一半,人才成本平均每人税后100万元,证实了传闻中的产业行情。

行业热度不减,发展至今,不少人将这项新技术形容为20年前的互联网、10年前的移动互联网,蕴藏无限机遇,渴求可以培育出新一轮“BAT”们,更期望自己可以身处在这项造福神话中。

但鲜为人知的是,AI人才市场处在冰火两重天的境遇。少数的高端人才掌握多数机会,拿下丰厚回报,余下的打工人是不被选择的分母,薪资提升有限,冷热不均是常态。

这位猎头说,根据最近的offer情况来看,中层及以下的算法、架构工程师,涨薪都在20%以内,其他职位大多平薪跳槽。

脉脉高聘最新发布的《2023人工智能人才洞察》报告显示,2022年人工智能新职位的平均月薪为43817元,而2023年1至8月上升至46518元,涨幅为6.16%,并非天文数字。

最近,王慧文和他的光年之外踩下急刹车,已经给中国大模型增添了几分冷峻色彩,狂飙的大模型创业潮并不如想象中纸醉金迷,“普通人的收入预期要降低一些,尽早从梦里醒来。”李晓远一语点破。

供养大模型的人

“人工智能车间里的数据女工。”这是辛蕊给自己数据标注员的工作打得标签。

去年产子休息了一段时间后,辛蕊已经无法胜任此前车间装配的工作,为了生活,她来到广州的城中村,找到了现在这份与AI密切相关的生计,更重要的是,入职前,公司承诺这份工作简单易上手,完全没有门槛,适合宝妈。

算力、数据、算法被称为驱动人工智能大模型发展的“三驾马车”。AGI流行后,为了让大模型可以识途认路,数据识别必不可少。无论是模型的训练还是后续对模型的进一步更新以满足实际应用,都需要大量的数据来支撑,在模型开发的成本中,数据成本也占据了很高的比重。

辛蕊最擅长的工种是图像识别,例如给某自动驾驶企业的图像进行标注。举个例子,当一张图像中有多个行人和车辆,需要将其分门别类,区分出不同物体和颜色,拉出框进行汇总标注。“2D图相对简单和固定,3D的动态图很复杂,物体移动容易造成遮挡,很容易出错,这时候需要标注员进行合理联想,然后拉框、标注。”

大模型里的“数字工人”:有人日结35,有人年薪300万

除此之外,这家公司还有语音、视频、文本等标注业务,其实恰好对应了AI世界的不同能力,一个标准的AI模型,背后可能是“辛蕊们”成千上万次的拉框标注,才能供养出一套成体系的大模型。

辛蕊透露,这份工作是底薪+按件计费的薪酬体系,底薪普遍在3000元上下,按日结算的拉框计费则很低,同组人经常开玩笑说“拉一个框,打一个标签,就是半个毛”。

因为熟练,她一天可以拉700个框,收入在35元上下,勉强算是一天的饭钱。如果准确率高,还能获得奖金,但奖励并不好拿,下单的客户要求的准确率底线在95%以上,如果准确率达到98%-99%才能获得奖励,这也意味着,辛蕊每拉100个框,至多只能错两次。

“一天下来,眼睛都胀胀的。”辛蕊说,这碗也算青春饭了。

在大模型风起后,AI企业对于数据标准的要求、标准和规则都日益苛刻,早期各大公司之间比拼的是技术能力,但随着竞争到末期,技术的鸿沟被抹平,数据就是重中之重,尤其是专业领域里的高质量私域数据,更为稀缺。

如果说辛蕊的拉框属于粗标,那卢珍妮的工作算是精细活。

日常,卢珍妮不但答题,还需要给大模型当判官,判断训练后的大模型是否可以提供答案,以及答案是否准确。卢珍妮是本科毕业生,专业是生物医学,她兼职的大模型企业提供定制化的解决方案,训练完备的模型可以提供多种常见慢性病和复杂性疾病的风险预测。

卢珍妮说,从事医疗行业大模型的判定,既要懂一点人工智能技术,又要懂相关生物信息技术,利用专业性,将知识“填鸭”式喂给大模型,这样的好处就是从数据源上不会出错。“大概每天答30道题,根据知识种类的不同,每道题在2.4元-4.8元之间,判断题则更高,日收入破百一般没有问题。”

除了收入的稳定性,训练AI的数据标注员们,也在面临一个迫在眉睫的问题:供养好AI大模型后,怕不怕自己失业?

两位标注员均表示,没有仔细思考过这个问题,但辛蕊自认为自己的工作是很容易被取代的,如果可以,她也希望能够成为卢珍妮。

原因很好理解。现在,你每输入一次谷歌验证码,都在义务劳动帮助谷歌训练AI,代替这群处于金字塔底层的人的工作。