海量新闻设为首页收藏本站我的收藏按 Ctrl+D收藏本站

XinWen.Mobi»首页 › 新闻 › 海量 › 英伟达Helix架构突破百万Token推理瓶颈

返回列表发新帖

英伟达Helix架构突破百万Token推理瓶颈

xinwen.mobi 发表于 2025-7-23 04:18:05 | 显示全部楼层 |阅读模式

英伟达Helix架构是基于Blackwell GPU平台的一种并行技术，它受DNA结构启发，通过分割显存和处理任务，有效突破了百万Token推理瓶颈，显著提升了大模型的上下文长度和并发能力，并降低了响应延迟。具体如下：创新的并行处理方式：Helix将模型Transformer层的注意力机制和前馈网络部分分开处理。它把KV、张量和专家等多个维度的并行性交织到一个统一的执行循环中，每个阶段在其自身的瓶颈配置下运行，同时复用相同的GPU池。KV并行技术：在注意力阶段，Helix使用名为KV并行（KVP）的新方法，将庞大的KV缓存分散到多个GPU上。通过将TP=2与KVP=2相结合形成2D布局，避免了因张量并行超过KV头数量时导致的内存和带宽开销增加。同时，KVP GPU持有与其本地KV头相关联的所有查询头，并冗余地计算QKV投影，确保模型推理精度。此外，KVP GPU之间沿着查询头维度进行单对单的全连接通信，通信成本和KV缓存大小无关，使得大模型上下文长度扩展到百万token时也不影响查询效率。重叠通信和计算：Helix通过重叠通信和计算来提高效率。一旦计算出一个token的注意力输出，就会启动该token的全对全交换，同时计算下一个token的注意力。这种方式将通信延迟隐藏在有用的工作之后，保持GPU利用率高，进一步加速实时解码。根据英伟达官网数据，使用DeepSeek - R1 671B模型测试时，在给定延迟下，Helix架构单GPU产出的token数是传统方法的32倍，可将并发用户数量提高高达32倍，且在低并发设置下能减少token与token间的最低延迟时间，提升用户交互体验。该技术有望重塑法律、客服、AI副驾等实时多轮交互应用，强化AI系统大规模在线部署能力。

GPU, KV, token, Helix, 并行

相关帖子

标致Oxia：来自火星的超级跑车梦想

喜欢: 0 回复: 0 xinwen.mobi
我国成功发射实践三十号A、B、C星

喜欢: 0 回复: 0 xinwen.mobi
音舞诗画《家住淮河边》在安徽蚌埠首演

喜欢: 0 回复: 0 xinwen.mobi
京港澳高速湖北北段改扩建工程临近收官

喜欢: 0 回复: 0 xinwen.mobi
甘肃酒泉：风电装备整体实现本地化配套

喜欢: 0 回复: 0 xinwen.mobi
浙江诸暨：打造高素质导游队伍助力文旅经济发展

喜欢: 0 回复: 0 xinwen.mobi
香港"小海豚"解锁湾区融合新姿势

喜欢: 0 回复: 0 xinwen.mobi
巢马城际铁路全线开始铺轨

喜欢: 0 回复: 0 xinwen.mobi
外国人来华入境卡网上填报新政实施

喜欢: 0 回复: 0 xinwen.mobi
支持二套房“商转公” 广东佛山出台稳楼市“十二条”

喜欢: 0 回复: 0 xinwen.mobi
车厘子价格回落明显消费者尝到“甜头”

喜欢: 0 回复: 0 xinwen.mobi
厦门海关查获807只“异宠”

喜欢: 0 回复: 0 xinwen.mobi
苏起：和谈是台湾最后一条路，不然就进入“垃圾时间”

喜欢: 0 回复: 0 xinwen.mobi
中国军网海外发布一切就绪高燃训练视频上线

喜欢: 0 回复: 0 xinwen.mobi
卖出6.8亿十五运会吉祥物如何成为顶流？

喜欢: 0 回复: 0 xinwen.mobi
江门中微子实验首个重大成果发布

喜欢: 0 回复: 0 xinwen.mobi
汕头与台湾工商业界举办系列活动促交流合作

喜欢: 0 回复: 0 xinwen.mobi
国台办发布会聚焦两岸交流、高市早苗挑衅言论等热点

喜欢: 0 回复: 0 xinwen.mobi
难发现、易转移、难治疗胰腺癌为何如此凶险？

喜欢: 0 回复: 0 xinwen.mobi
入门即高配，深蓝L06正式上市售13.29万起

喜欢: 0 回复: 0 xinwen.mobi
巴菲特“弥补”遗憾！谷歌成为今年最火“科技七巨头”

喜欢: 0 回复: 0 xinwen.mobi
税务部门高度关注！“拆分收入”偷税遭严打

喜欢: 0 回复: 0 xinwen.mobi
北上生活圈升级：港人开始北上贷款、买社保了！

喜欢: 0 回复: 0 xinwen.mobi
地产公司密集换帅，近半年平均每周都有“一把手”换人

喜欢: 0 回复: 0 xinwen.mobi
昆明植物园枫香大道层林尽染引八方游客

喜欢: 0 回复: 0 xinwen.mobi
黄维樑：我阅读，我享受人生。

喜欢: 0 回复: 0 xinwen.mobi
文物正以与时俱进的方式书写着古今对话。

喜欢: 0 回复: 0 xinwen.mobi
大湾区超级工程有何“连城诀”？

喜欢: 0 回复: 0 xinwen.mobi
广东观众以文明之姿书写“东道主”的温情答卷

喜欢: 0 回复: 0 xinwen.mobi
全运会何以成为了中国经济“场景创新”试验场

喜欢: 0 回复: 0 xinwen.mobi
当"敢拼会赢"遇上"进博机遇"

喜欢: 0 回复: 0 xinwen.mobi
福建队选手邱祺缘夺冠

喜欢: 0 回复: 0 xinwen.mobi
永春马跳水厂计划年底前通水

喜欢: 0 回复: 0 xinwen.mobi
破题海洋强基怎样刷新海洋科创“贡献值”

喜欢: 0 回复: 0 xinwen.mobi
42.195公里，见深港情长

喜欢: 0 回复: 0 xinwen.mobi
入冬防心梗，务必要注意这4件小事！

喜欢: 0 回复: 0 xinwen.mobi
粤港澳大湾区第五届职业技能大赛落幕

喜欢: 0 回复: 0 xinwen.mobi
专家呼吁将运动处方纳入医疗服务体系

喜欢: 0 回复: 0 xinwen.mobi
2025陆海新通道国际物流博览会在重庆举行

喜欢: 0 回复: 0 xinwen.mobi
北京市密云区大城子镇赤松茸基地实现灾后复产

喜欢: 0 回复: 0 xinwen.mobi
湖北钟祥：千亩花海铺就乡村“致富路”

喜欢: 0 回复: 0 xinwen.mobi
封关在即！侨商、专家共话“十五五”海南自贸港新机遇

喜欢: 0 回复: 0 xinwen.mobi
探访成都市锦江区锦官驿街道“U善里”

喜欢: 0 回复: 0 xinwen.mobi
07'48'' 人形机器人走入千家万户还要多久？

喜欢: 0 回复: 0 xinwen.mobi
最后一个电车免税的“金九银十”！近40款新车扎堆上市

喜欢: 0 回复: 0 xinwen.mobi
用脑波踢足球 VR体验消防救援科普原来可以如此有趣

喜欢: 0 回复: 0 xinwen.mobi
孙文西路步行街灯影花

喜欢: 0 回复: 0 xinwen.mobi
该剧将于9月29日至10月5日在上海上剧场演出！

喜欢: 0 回复: 0 xinwen.mobi
AI赋能第22届东博会大批“硬核科技”亮相

喜欢: 0 回复: 0 xinwen.mobi
河北昌黎：海上光伏项目建设忙

喜欢: 0 回复: 0 xinwen.mobi

回复

使用道具举报

返回列表发新帖

|周边二手车|手机版|标签|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2026-1-15 00:07 , Processed in 0.160937 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表