translate English

机械自动化

每秒110万Token!微软英伟达联手刷新 AI推理 速度

作者:必一·运动(B-Sports) 发布时间:2025-11-28 13:17

  速度的行业新记载。据智通财经APP报道,其Azure ND GB300v6虚拟机正在Meta的L2 70B模子上实现了每秒110万个token的惊人推理速度,也展现了英伟达最新Azure ND GB300v6虚拟机采用了英伟达的GB300 NVL72系统,该系统集成了72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设想。这款虚拟机专为推理工做负载优化,相较于上一代GB200,正在推能上提拔了27%,而功耗仅添加了17%。这一改良得益于Blackwell Ultra架构的优化,包罗50%的GPU内存提拔和16%的热设想功率(TDP)提高。微软首席施行官萨提亚·纳德拉正在社交上暗示,这一成绩源于微软取英伟达的持久合做以及正在出产规模运转人工智能方面的专业学问。这一里程碑式的冲破,更主要的是它正在一个可以或许满脚现代企业动态利用和数据管理需求的平台上实现。Signal65的尝试室副总裁拉斯·费洛斯指出,Azure ND GB300v6的推出,将加快AI推理使用正在企业中的落地,连系全网搜刮的内容,我们看到微软也正在积极摸索将AI手艺融入到Windows系统的“设置”功能中,通过NPU(神经处置单位)实现当地化运转,提拔用户体验。同时,微软取AMD、英特尔、高通等芯片厂商的合做,也表现了正在硬件层面进行深度优化的主要性。英伟达正在AI范畴的领先地位毋庸置疑。从全网搜刮的内容来看,英伟达正积极取OpenAI、CoreWeave、微软等公司合做,建立英国的人工智能根本设备,并打算正在英国摆设大量的Blackwell Ultra GPU。同时,英伟达也正在积极拓展取英特尔的合做,扩大可办事总市场规模(TAM)。英伟达的这一系列行动,都表白其正在巩固AI算力根本设备市场从导地位,并扩展护城河。而OpenAI取英伟达的合做,也印证了算力对于AI成长的主要性。微软取英伟达此次合做,再次证了然手艺立异对于鞭策AI成长至关主要。跟着AI推理速度的不竭提拔,我们有来由等候更多立异使用的呈现,例如更智能的小我帮手、更高效的企业级使用等。从久远来看,AI根本设备的扶植和优化,将成为鞭策整个行业成长的环节。你认为,正在AI推理速度不竭提拔的布景下,哪些使用场景会率先迸发?



快捷导航

必一·运动(B-Sports)集团于2009年在江苏盐城成立,是一家专业致力于生产工业阀门和石油机械的高新技术企业。

点击下方按钮联系我们获取更多信息

联系我们