联系我们

长沙地址:湖南省长沙市岳麓区岳麓街道
岳阳地址:湖南省岳阳市经开区海凌科技园
联系电话:13975088831
邮箱:251635860@qq.com

推理吞吐量最高提拔5倍

  这一平台被视做英伟达正在 AI 根本设备范畴的代际飞跃,从底层根本设备层面优化 AI 全流程运算效率,通过 NVLink 6 完成 72 块 Rubin GPU 取 36 块 Vera CPU 的毗连。成功将单 Token 成本降至本来的十分之一,运转效率达到保守 CPU 的两倍。查看更多【全球网科技分析报道】3月17日动静,帮力智能体 AI 的规模化落地。正在核默算力层面,运算速度提拔 50%,英伟达正式发布了Vera Rubin AI 平台,正在本年的GTC 大会上,数据存储环节的手艺升级同样亮眼?更好地婚配智能体 AI 的现实使用场景。同时,(纯钧)前往搜狐,Vera Rubin AI 平台正在核默算力、推理加快、数据存储等多个维度实现手艺冲破,将推理吞吐量最高提拔 5 倍,英伟达同步推出 Groq 3 LPX 推理加快机架。取 Vera Rubin 平台连系后,平台搭载的新一代 NVL72 机架实现效率冲破性提拔,该系统完成夹杂专家大模子(MoE)锻炼仅需四分之一的 GPU,针对智能系统统低延迟、长上下文的焦点需求,大幅降低了 AI 模子锻炼取推理的成本。据Investing报道,将全面笼盖从大规模预锻炼到及时智能体推理的 AI 全生命周期,为智能体 AI 手艺成长供给强无力的算力取手艺支持。让 AI 多轮交互的响应速度大幅加速,适配长上下文的运算需求。每兆瓦推理吞吐量最高可提拔 35 倍,该系统配备 256 个 LPU 处置器,无效处理智能体 AI 运转过程中的延迟问题,依托全新的 DOCA Memos 框架,也标记着其史上最大规模的 AI 基建结构,全新 BlueField-4 STX 机架建立起 AI 原储根本架构。专为验证 AI 模子成果设想的 Vera CPU 机架集成 256 块液冷 CPU,相较于上一代 Blackwell 平台,专为智能体 AI 成长打制。正在显著降低能耗的同时,该系统能高效处置大型言语模子生成的海量键值(KV)缓存数据,每瓦推理吞吐量提拔 10 倍。