芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西5月20日报道,台北国际电脑展COMPUTEX 2025今日盛大开幕,芯片产业领袖云集,陈立武首次以英特尔CEO身份赴台,并与中国台湾供应链伙伴餐叙。英特尔更是一举发布多款GPU和AI产品,包括英特尔锐炫Pro B50/B60 GPU、Gaudi 3 AI加速器、轻量级开源软件框架Intel AI Assistant Builder,展露其在AI及专业视觉领域的最新布局。
英特尔锐炫Pro B60/B50 GPU基于Xe 2架构,具备AI特性,为要求严苛的AI推理工作负载和工作站应用而设计,进一步丰富了英特尔专业级GPU产品线。
其中,锐炫Pro B60配备24GB显存,AI峰值算力为197TOPS,适用于推理工作站;锐炫Pro B50配备16GB显存,AI峰值算力为170TOPS,适用于图形工作站。
两款GPU均搭载英特尔XMX AI核心和先进的光线追踪单元,并支持多GPU扩展,通过将高显存容量与关键软件兼容性相结合,为创作者和AI开发者提供了可扩展的、经济高效的解决方案。
锐炫Pro B50直接面向零售市场,建议零售价为299美元(约合人民币2159元),性价比优势突出。锐炫Pro B60将主要通过B2B模式进行项目采购,正在与多家系统集成商和OEM厂商进行合作。
华擎、蓝戟、Lanner、铭瑄、傲世、Senao和撼与科技等AIB合作伙伴将于今年6月开始提供英特尔锐炫Pro B60 GPU样品。英特尔锐炫Pro B50 GPU将于今年7月开始在英特尔授权经销商处上市。
有合作伙伴将提供锐炫Pro B60的单卡双GPU方案,板载显存容量达48GB。
英特尔Gaudi 3 AI加速器提供PCIe和机架级系统部署选择,为企业和云AI推理提供可扩展的开放解决方案。英特尔Gaudi 3 PCIe卡支持在现有服务器数据中心环境中进行可扩展的AI推理,将于今年下半年上市。
在CES 2025首次亮相后,英特尔AI Assistant Builder软件框架现已在GitHub上提供公开测试版。该框架专为在基于英特尔AI PC上本地构建和运行自定义AI agents而设计,可帮助企业或个人快速构建并部署AI agents。
一、锐炫Pro B50:AI性能提升至3倍,性价比较RTX A1000翻番
英特尔锐炫Pro B50 GPU实现了同类价位段最高配置:拥有16个Xe核心,配备16GB显存、128 XMX引擎,显存带宽为224GB/s,AI峰值算力(Int8)为170TOPS,单卡功耗仅70W。PCIe Gen 5速度的提升也会带来10%-20%的性能提升。
与同类产品对比,锐炫Pro B50的显存容量、驱动程式优化、PCIe Gen 5提升均表现更优。同类产品通常配备6GB或8GB显存。
与上一代产品及竞品相比,锐炫Pro B50在图形和AI推理性能上有1.1倍~3.5倍的提升。
在通用性能方面,锐炫Pro B50相比上一代产品提升50%~130%。其性价比不仅相较锐炫Pro A50、英伟达RTX A1000翻倍提升,比起锐炫Pro A60也略胜一筹。
该系列GPU在Windows上兼容消费级和专业级驱动程序,在Linux上支持容器化的软件栈。其软件栈可以简化AI部署,并支持逐步升级和功能优化。
新发布的两款GPU针对AEC(建筑、工程、施工)和推理工作站进行了优化,并通过大量ISV认证和优化的软件提供稳定、可靠的性能。
英特尔副总裁兼客户端显卡总经理Vivian Lien称,全新英特尔锐炫Pro GPU为一直在寻求针对性解决方案的中小型企业,提供了易于获取且可扩展的解决方案。
二、锐炫Pro B60:AI峰值算力197TOPS,跑DeepSeek-R1倍杀RTX 5060Ti
锐炫Pro B60拥有20个Xe核心,配备24GB显存、160 XMX引擎,显存带宽为456GB/s,AI峰值算力(Int8)为197TOPS,根据不同系统设计,单卡功耗区间为120~200W。
从性能来看,锐炫Pro B60运行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模型时,相比英伟达RTX 2000 Ada 16GB、RTX 5060Ti 16GB的吞吐量更高。
更大参数规模的模型,需要更大的显存。7B模型若采用FP16进行推理,至少需要16GB显存。70B模型采用INT4量化,需要超过30GB的显存,若采用FP16,显存需求更是将超过100GB。
通过多卡互连,锐炫Pro B60能够以更大的显存容量,来支撑大模型运行,并在上下文和并发扩展方面展现优势。一张锐炫Pro B60跑不了32B参数量的DeepSeek-R1蒸馏模型,但2张GPU就能支持20k tokens上下文,4张GPU可将上下文窗口扩展到100k以上,足以直接输入一本不太厚的书或论文。
企业级应用场景对并发性提出了更高的要求。在设定8k上下文窗口的情况下,单张锐炫Pro B60无法支撑DeepSeek-R1 32B FP8精度模型的运行。使用两张显卡时,系统可支持5-6个并发用户。而当采用四张显卡、利用全部96GB显存时,系统可支持超过50个并发用户,足以满足中小企业的大部分需求。
英特尔自己也用锐炫Pro B60来解决问题。在开发酷睿Ultra第二代Lunar Lake产品时,英特尔在VPC解码过程中发现了一个Bug,表现出现花屏现象。这类问题通常非常复杂,可能跨越多个软件层,且代码量巨大。一位经验丰富的工程师通常需要花费数天时间,从数万行log中发现问题,debug找到根源,并提供代码修复方案,然后重新进行测试。
而英特尔在配备4张锐炫Pro B60和至强W处理器的服务器上部署运行多AI agent协同方案,仅花费数小时便完成了从问题定位到代码修复的全过程,并最终完成了所有问题的修复和重新测试。
三、8张锐炫Pro B60互连,可跑1500亿参数大模型
推理工作站具有广阔的发展前景,主要体现在:1)安全部署,数据无需上传至云端,可在本地处理;2)提供一站式解决方案,将所有软件置于容器中,帮助客户解决问题,易于设置;3)易于扩展,可灵活配置不同数量的显卡;4)成本效益具有显著优势。
英特尔发布了一款可配置的工作站级英特尔至强平台(代号Project Battlematrix),旨在减少AI开发人员的摩擦点。
借助高达192GB的视频随机存取存储器(VRAM),它最多可支持8张英特尔锐炫Pro B60 24GB GPU,运行高达1500亿个参数的中等规模且精度高的AI模型。
为了优化AI推理性能,英特尔在底层软件上引入GPUDirect Peer-to-Peer技术,可在GPU之间直接拷贝数据,不需要CPU参与。此外,其张量并行算法则可以把一张显卡放不下的大模型平均切分到4张或者是8张卡上进行推理,然后把结果合并输出给用户。
英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题,在容器内部对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。
其Project Battlematrix Linux软件栈如下图所示,Linux操作系统位于容器之外,往上是用户层驱动,Level 0是英特尔的底层驱动,再向上是英特尔OneAPI和XPU Manager,上层是英特尔对生态系统的支持。目前该软件栈采用vLLM Serving,未来也将支持SGLang等其他开源软件。英特尔对各层软件进行了完整的验证和优化,并通过容器形式一键交付给客户,以方便部署。
英特尔还展示了软件功能路线图,预计第三季度发布经过完整验证和产品化的容器,第四季度推出SR-IOV、VDI虚拟桌面的软件性能优化以及完整的管理功能。
四、英特尔Gaudi 3:PCIe卡AI峰值算力达1678TFLOPS,机架级配备8.2TB HBM
英特尔进一步推进其AI战略,推出英特尔Gaudi 3 AI加速器的全新部署方案。
英特尔Gaudi 3 PCIe卡配备128GB HBM2e,FP8精度下AI峰值算力达到1678TFLOPS,支持在现有服务器数据中心环境中进行可扩展的AI推理。
以AI大模型Llama为例,得益于可扩展配置,可灵活运行从轻量级Llama 3.1 8B到规模较大的Llama 4 Scout或Maverick等各种规模的AI模型。
英特尔Gaudi 3机架级系统参考设计带来了极大的灵活性和可扩展性,每个机架最多可容纳64个加速器,并拥有高达8.2TB的高带宽内存(HBM)。
其机架级架构针对大型AI模型进行深度优化,可提供实时推理性能。
开放式模块化设计打破了供应商的限制,而有线背板和盲插2D全机架布线让安装和维护变得更加简单。通过液冷,这些系统可提供强大的性能,并有助于TCO的控制。
这些配置支持云服务提供商(CSP)的定制化需求和开放计算项目(OCP)设计规范。英特尔承诺构建开放、灵活和安全AI基础设施。
结语:英特尔迈向全面转型,力补AI产品实力,强调“执行力”与“说真话”
此次新品发布正值英特尔与台湾科技生态系统合作40周年。英特尔进一步扩大专业级GPU阵容,提供大显存、高性价比以及为AI推理和专业工作站量身定制的配置,并展示了其AI加速器产品及AI Assistant Builder的可用性。这些新产品有望为英特尔开辟新的局面。
在英特尔台湾40周年晚宴活动上,陈立武发表致辞,谈到英特尔将全面转型,重回工程导向,不仅做CPU,还要构建完整的AI计算系统,包括芯片、软件、存储、互连及工作负载整合,并强化与中国台湾科技供应链及客户的交流合作。
陈立武再度表露改造英特尔的决心和策略,以及对“新英特尔”的期许。英特尔在PC市场有超过68%的市占率,在服务器市场有55%的市占率。据陈立武透露,一些客户反馈为了提高系统性能,正在评估推动开发定制芯片。
陈立武强调了两个目标:打造好产品,令客户满意。为此,他让英特尔工程团队直接向他汇报,确保做出正确的芯片产品,并积极招募人才。他告诉团队:“如果你不先告诉我坏消息,而是让我从客户口中得知,那你就麻烦大了。我要的是诚实、真实的文化。”
此次来台行程中,陈立武拜访了许多OEM客户,听到很多反馈。“你会看到一个全新的英特尔。”他相信英特尔未来将以更谦卑、更开放的态度,主动倾听客户声音,不仅要推出好产品,更要让生产稳定、准时、品质稳定。
“我相信只要持续执行、执行、执行,就能让英特尔恢复元气。”陈立武说,他不是搞营销的,不会吹嘘表现,英特尔将用成果说话。