
来自HC会议Qubit的Mingmin |官方帐户QBITAI HUAWEI的芯片节奏已经完全开始了新的曲目。在Kirin芯片中Yu Chengdong San折叠手机之后,AI Computing Power Chips也是最新开发的。在整个华为连接的会议上,旋转的董事长Xu Zhijun带来了世界上最强的计算能力和集群Atlas 950 Superpod和Atlas 960 Supernodes Supernodes,分别支持8192和15488 Ascend Cards。预计它将在2026年的四季度推出Atlas 950 Superpod,该季度将完全超过NVL576,预计将于2027年推出。它将在未来两年内仍是全球最大的计算能力,并且还发布了世界上最强的超级节点集群,即Atlas 950超级群集和Atlas 950超级集群和Atlas 960 Exclas 960超级Clasters。计算功率量表超过500,000张卡片,并分别达到100万张卡片,并且在世界上最强的簇中也是稳定的。此外,哇魏还宣布了未来两年的上升芯片和扣子芯片的进化计划。除了明年的950/960系列,950/960等。明年,Ascend 950PR将推出,采用华为自我开发的HBM芯片。华为遵守“每年一代,双重计算能力”的节奏,并将继续更改带宽数据和技术形式,以解决对AI计算强度的无限需求。它宣布了ASTEND 950系列,Astend 960系列和Astend 970系列的演变路线。 Asteng 950系列Asteng 950芯片体系结构的亮点如下:对矢量提高矢量的新支持,以增加相互关联的带宽2.5倍的计算计算强度,Huawei的特定芯片是Huawei的自我开发的HBM的特定芯片,如下:ASTENG 950PR的优化:优化的场景。该芯片是由于开发而推出的AIGC的操作,输入的上下文变得更长,并且计算资源的消耗增加。在电子商务,内容和社交媒体平台中,建议算法需要更高的准确性和较低的延迟。技术技术:使用华为的华为记忆记忆解决方案可以显着降低成本。产品表单:标准卡和超节点服务器。清单时间:2026年第一季度。上升950DT位置:培训和深入学习情况。技术技术:自我开发HBM的采用:HIZQ 2.0的内存能力高达144GB,访问带宽高达4TB/s。互连带宽增加到2TB/s。支持各种数据格式,例如FP8,MXFP8,MXFP4,HF8等,以提高训练效率。市场上级:2026年第四季度。上升960(在计划下)位置:BETSCARE培训芯片和各种规格与Ascend 950相比,各种规格翻了一番。现代技术:计算强度,记忆力,记忆力,访问S撒尿,相关端口的数量加倍。它支持华为HI-F4开发的格式数据。目前,它是该行业准确性的最佳4位实施,它可以改善吞吐量,并且比FP4的FP4解决方案更好。清单时间:2027年第四季度。上升970(在计划中)人口:全面的培训筹码升级,各种指标大大改善。初步规格:与ASTEND 960,FP4和FP8计算强度相比,访问带宽的记忆至少增加了1.5倍。清单时间:2028季度。 ATLAS 950:预计世界第一的第一年将在未来两年中保留。华为副主席兼扶轮社Xu Zhijun承认,华为已被阻止了统一,但是通过在过去30年中积累了基本软件和建筑系统,它可以通过最终计算体系结构集群集群LE来包括大量的“超级计算机”中的筹码vel。超级节点是高速互连技术的大量计算单元(例如芯片和服务器),可以集成一台在逻辑上统一的AI巨头计算机,并且可以像一台计算机一样被知道,思想和理由。它成为建设AI基础设施的新范式。目前,华为拥有Atlas 900 A3超级节点,支持384 Asteng 910c芯片。最大计算强度达到了300pflops,它仍然是世界上最强的AI超级节点。自推出以来,已经交付了300多套,并为20多个客户提供了服务。 Atlas 950 Super Node最新的Atlas 950 Super节点的发行版支持8,192升950 DT芯片,其20倍以上Atlas 900尺寸。它由128个计算柜和32个连贯的柜子组成,覆盖了近1,000平方米的面积,并加强了所有光学连接。主要指标如下:FP8计算能力:8 EFLOPS FP4计算能力:16 EFLOPS互连带宽:16.3 pb/s(超过10倍的互联网全球带宽)内存内存:通过传球1152 TB总训练:4.91MN TPS(比Atlas 900高17倍)结果:1960万TPS TPS TPS TPS TPS(比Atlas 900高26.5倍)。与将于2025年推出的NVL144相比,卡量表是该卡量表的56.8倍,最终计算功率比该量表高出6.7倍,内存容量是该计算能力的15倍,并且互连带宽比其高72倍。 Atlas 950 Super节点将于2026年第四季度推出。预计将在未来两年中仍然是全球最大的计算能力。 ATLAS 960超节点也与Atlas 960 Hypernode一起释放。它基于ASTEND 960/ATEND 950DT芯片,最多支持15,488张卡。使用跨块全光互连。根据950:FP8计算能力:30 EFLOPS FP4计算能力:Atlasdoble中的基本指标再次60 EFLOPS内存能力:4460 TB互连带宽:34 pb/s大型模型火车仅用于AI,但还可以重新置换一般计算。华为发布了950和960芯片以及相应的超级节点。 950处理器:版本:96核/192线程; 192个内核功能/384线程:支持机密计算,并添加了四个新的安全分离层。列表时间:2026年第一季度。基于950年代,它形成了Taishan 950超级节点。这将是世界上第一个通用计算的超级节点。它支持多达16个节点,32个处理器,并且最大内存为48TB。支持DIIT是内存,SSD和DPU池。 GaussDB在Taishan 950 Super节点中开发的架构读写不需要共享的数据库更改,并且性能提高了2.9倍。最后,它可以用大型机和小型机器正确替换传统数据库。 Taishan 950与共享GaussDB将成为所有类型的终止者大型机和微型摄像机,通过各种应用程序方案以及Oracle的Exadata数据库服务器完全取代了大型机和微型摄像机。除了主数据库的方案外,Taishan 950超节点在更广泛的方案中也表现良好:例如,虚拟化环境的内存使用率增加了20%,在大数据方案中,实时数据处理时间降低了30%。发布日期是2026年的第一季度。开发Wanka超级节点的最大挑战在于互连技术。华为通过系统的变化克服了两个主要问题:第一个是如何实现长期和高可靠性。柜子之间有许多大型超节点柜和较长的连接距离。当前的电气和光学互连技术可能无法满足需求。其中,当前的电气互连技术在高速和C下具有短距离连接在大多数情况下,唯一的支持两个机柜。尽管当前的光学互连技术可以在长距离内连接许多机柜,但它不能满足可靠性的需求。第二个是如何实现Malmy带宽和低潜伏期。当前,跨块卡之间的互连带宽很低,超级节点需求之间的差距为5次;跨块卡之间的延迟非常巨大,当前的互连技术最好是3微秒,这与Atlas 950/960的设计要求仍然有24%。当延迟小于2至3微秒时,它接近物理极限。尽管增加0.1微秒非常困难。基于此,华为建立了UnifiedBus的互联网协议,并正式开设了Yunqu 2.0技术规格,邀请行业合作伙伴开发生态系统并促进超级节点行业的发展。最后,华为发布了最后的动作,并发行了一个超级群集:Atatlas 950的超级群集。它由64个Atlas 950超级节点并行,集成了520,000 AST 950T芯片。最终的计算能力达到524 EFLOPS。支持两个网络协议Cuboe和Roce,CuboE对延迟,可靠性和成本有更大的好处。列表的日期是2026年的第四季度。此外,还计划了Atlas 960 SuperPlus群集。该量表将达到100万级的卡,FP8最终达到2个Zflops,FP4达到4个Zflops。列表的日期是2027年第四季度。最后,徐Zhijun强调,华为将继续满足基于Lingques的超节点和集群对计算能力快速增长的需求,促进人工智能的可持续发展,并创造更多的价值。
特别声明:上面的内容(包括LarCloud或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。这个平台表格仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。