translate English

机械知识

19岁华裔女孩融资126亿元

作者:必一·运动(B-Sports) 发布时间:2025-11-10 15:43

  跟着后锻炼数据需求变得越来越复杂,更轻巧的组织布局和更具参取感的平台生态显得越来越主要。Surge AI、Datacurve等公司的兴起恰好正在于,它将这一低附加值行业“产物化”,让专业人群以乐趣和挑和感参取数据出产。某种意义上,把“人力数据”做成一项可扩展的数字经济办事。

  然而,这一逻辑的前提是“稀缺性”可以或许持续。若是AI自监视进修、从动标注、合成数据手艺继续提速,那么对人工标注的依赖将不成避免地被减弱。所以,高质量数据简直是AI的刚需,但这是一个既又懦弱的生意。

  据《The Information》取 Sacra 的公开数据,Scale AI 正在 2024 年营收约 8。7 亿美元,最新估值约 290 亿美元,对应的市销率约 33 倍;而Innodata 正在同年营收 1。7 亿美元、市值 12 亿美元摆布,市销率约 7 倍。 比拟之下,Surge AI 虽然尚未完成新一轮融资,但市场传出的方针估值正在 150 亿至 250 亿美元之间,而公司2024 年的营收被多家报道“跨越 10 亿美元”。若按此区间估算,其市销率大致正在 15 至 25 倍之间。

  因而,Surge AI没有采用保守的人力外包模式,而是搭建高技术承包商收集,通过复杂的手艺和算法系统,进行质量节制、反做弊以及优化工做流程,最终交付高质量的数据产物,而非仅仅是人力资本。据悉,Surge AI曾经取跨越100万名承包商合做,建立并向谷歌、Anthropic 和 OpenAI 等公司出售高质量的数据集。

  海外,数据标注公司成为这波AI高潮中本钱结构的主要类目。本年6月,Meta斥资 14。3 亿美元入股 Scale AI,使其估值攀升至 290 亿美元。一个月后,Surge AI被曝正打算以 250 亿美元估值融资 10 亿美元,而这家公司客岁营收方才冲破 10 亿美元。

  这种模式的高效已正在市场端获得验证——公司成立两个月即实现营收破百万美元,现在已为全球跨越一半的根本模子尝试室以及 Facebook、苹果、亚马逊、谷歌等企业供给高质量代码数据,用以锻炼下一代大型言语模子。

  数据标注素质上是要把大量机械无解的非布局化数据翻译成机械能理解的布局化数据。跟着强化进修(RLHF)正在人工智能系统的锻炼中变得越来越主要,对精细标识表记标帜、详尽入微的数据集的需求也日益增加,环绕着数据标注和处置的预算也正在飙升。

  Surge AI的创始人Edwin Chen 同为华裔,此前担任过谷歌和 Meta 工程师。值得一提的是,正在融资动静传出前,Surge AI客岁营收跨越 10 亿美元,跨越了 Scale AI,后者同期营收为 8。7 亿美元。

  市场遍及认为,这反映的是投资人对 Surge AI “数据根本设备化”潜力的押注,而非当下盈利能力的实正在映照。

  Surge AI 被视为能持续出产“专家级锻炼数据”的环节根本设备,其客户名单中包罗 OpenAI、Anthropic 等焦点尝试室,这一绑定关系让本钱情愿提前领取将来数年的增加溢价。

  奇特、垂曲、难以复制的数据资本,是将来AI企业建立护城河的环节。担心的“数据干涸”其实是一个伪命题——实正未被开辟的金矿,存正在于企业内部持久沉淀的非公开数据中。将来AI锻炼的合作,将不只正在于谁具有更大都据,而正在于谁能更快地把数据为模子可理解的学问。

  “大模子之所以存正在瓶颈,就是由于缺乏丰硕的、细心挑选的高质量标注数据。”于是,Datacurve测验考试沉构数据办事这门“苦活累活”的生意。

  一些投资者认为数据标注是人工智能成长的持续必需品,并预测领先的人工智能尝试室将持续供给这一需求。另一些人则担忧,跟着人工智能手艺的前进和对人工标注需求的削减,该行业的低利润率和对人力的依赖可能会使其容易遭到从动化的影响。

  正在AI锻炼中,数据质量的主要性不问可知。通俗来讲,“garbage in,garbage out”(垃圾进,垃圾出),这也意味着,模子智能提拔明显离不开高质量数据供给。

  利润率则是另一个现实。按照 The Information 报道,Scale AI 正在 2024 年的营收约 8。7 亿美元,但净利润不脚 1 亿美元。Surge AI 虽然已实现盈利,其利润率同样受制于人力取审核成本。

  Datacurve的灵感源于Serena正在AI独角兽 Cohere 练习的履历。期间她发觉受限于成本等缘由,AI标注公司不会聘请高本质的软件工程师来做最根本的数据标注工做,因而AI公司很难获得专家级的标注数据。

  Datacurve 的兴起并非偶尔。正在大模子迸发的布景下,AI企业遍及陷入“算力、算法、数据”三要素的博弈之中——算力的合作被巨头垄断,算法的冲破门槛极高,特别是高质量人工标注数据,成了创业公司能切入的少数机遇之一。

  若是说 Surge AI 和 Scale AI 的估值反映了硅谷对“数据即办事(Data as a Service)”的将来,那么这种也面对最严峻的查验。正在AI的金矿里,卖铲子的人从不缺市场。实正的问题是,谁能制制下一代的铲子?

  但激励并非焦点,数据标注的报答永久低于软件开辟等办事。因而,Serena认为Datacurve更像是正在运营一款用户社区型产物,而非保守的数据标注流水线。通过逛戏化机制取绩效排名提拔数据质量,让贡献者正在“玩中做数据”。

  做为一家晚期公司,Datacurve目前专注于软件工程范畴,但Ge暗示,他们的模式同样合用于金融、市场营销以至医疗等其他范畴。Ge总结道:“我们正正在做的是,建立一个可以或许吸引并留住各个范畴高程度专业人士的后锻炼数据收集根本架构。”。

  区别于依赖大量外包工人的保守数据标注模式,Datacurve采用了一种更“赏金猎人”系统——通过平台 Shipd,工程师能够选择算法、测试、UI/UX等分歧类型的挑和,每完成一个使命即可获得5至50美元的励。公司目前具有跨越 1400名注册工程师,累计发放赏金已超 100万美元。

  Edwin Chen 认为人工智能有能力“创做出获得诺贝尔的诗歌,处理黎曼猜想,并发觉的奥秘”——但前提是它接管的数据锻炼可以或许捕获人类的专业学问、创制力和价值不雅。他告诉《时代》:“实正高质量的数据对人工智能和通用人工智能的将来至关主要。”。

  本年6月,Meta以143亿美金收购Scale AI 49%股权,公司估值接近290亿美元。虽然两周后,Scale AI内部呈现人员协做坚苦,导致客户流失,但AI数据办事范畴曾经成为全球关心核心。取此同时,合作敌手Surge AI传出打算正在公司汗青上初次融资,筹集高达 10 亿美元,方针估值高达250 亿美元。



快捷导航

必一·运动(B-Sports)集团于2009年在江苏盐城成立,是一家专业致力于生产工业阀门和石油机械的高新技术企业。

点击下方按钮联系我们获取更多信息

联系我们