常用工具 医生入驻 免费问医生

英特尔发布Project Battlematrix推理工作站软件更新

2025-08-28 08:01:52 来源:揽名责实网   

厦门推进乡村振兴千亿投资 5年撬动41个千万级农业项目

英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。

今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。

英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。

全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。

LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新:

vLLM:

·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍

·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10%

·逐层在线量化,减少所需的GPU内存

·支持vLLM中的PP(流水线并行)(实验性)

·支持torch.compile(实验性)

·推测解码(实验性)

·支持嵌入和重排序模型

·增强的多模态模型支持

·最大长度自动检测

·数据并行支持

OneCCL基准测试工具支持

XPU Manager:

·GPU功耗

·GPU固件更新

·GPU诊断

·GPU内存带宽

英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。

希望以上内容对您有帮助。

阅读全文
相关推荐
休闲视频推荐精选问答
养生文章推荐
太忻建设集团领导与山西省太原市水务局党组书记、局长会谈

出入平安!春运安全出行锦囊来了

太忻建设集团领导与山西省太原市水务局党组书记、局长会谈
8月16日,太平洋建设大区总裁、太忻建设董事局主席张艳丽与太原市水务局党组书记、局长赵生魁会谈,双方就太原市水系规划及相关合作事宜进行交流。 张艳丽介绍了太平洋建设的发展历程、最新战略布
汇川技术与您共赴2025国际显示技术及应用创新展

拉伊奥拉:国米和米兰买不起现在的巴洛特利

汇川技术与您共赴2025国际显示技术及应用创新展
DIC EXPO 2025国际(上海)显示技术及应用创新展数自融合构建显示智造新生态8月7日-9日上海新国际博览中心(E1馆)特1A32国内在LCD领域积淀深厚、投资雄厚,同时加速布局高端新型显示技术
老人突发心脏病送医遇车流高峰 交警开道护送

东风特汽:锚定氢能源赛道 冲刺年产销整车一万台

老人突发心脏病送医遇车流高峰 交警开道护送
老人突发心脏病送医遇车流高峰 交警开道护送发布时间:2018-06-07 14:37 来源:豫都网 我要投稿[摘要]□记者高志强通讯员赵慧 本报安阳讯安阳一老人突发心脏病急需就医,却在途中遭遇车流高峰
薛之谦和李小璐上热搜原因是什么?李雨桐爆料两人关系不一般

家具炒复古概念 做旧身价顿涨-

薛之谦和李小璐上热搜原因是什么?李雨桐爆料两人关系不一般
薛之谦和李小璐上热搜许久不见的李雨桐在凌晨直接连发三条微博,直接指明薛之谦和李小璐的关系不一般,在这一条微博发出去之后,李雨桐又接着爆料称还有其他人,不过是用字母代替的。本以为李雨桐会直接爆出来,没想
英特尔Gaudi 2E AI加速器加入DeepSeek

花高价也不一定能够买到优质实木床!

英特尔Gaudi 2E AI加速器加入DeepSeek
在英特尔Gaudi 2E的支持下,DeepSeek-V3.1无论是在问答还是编码上,能力都有着显著提升。英特尔宣布,Gaudi 2E AI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出
老人突发心脏病送医遇车流高峰 交警开道护送

2022投資關鍵四問》通膨與升息風險壓境 上下半年標的不同|天下雜誌

老人突发心脏病送医遇车流高峰 交警开道护送
老人突发心脏病送医遇车流高峰 交警开道护送发布时间:2018-06-07 14:37 来源:豫都网 我要投稿[摘要]□记者高志强通讯员赵慧 本报安阳讯安阳一老人突发心脏病急需就医,却在途中遭遇车流高峰
滇黔桂消费维权联盟对云南腾冲民宿行业开展消费体察

“中国好家居”评选活动重磅上演啦

滇黔桂消费维权联盟对云南腾冲民宿行业开展消费体察
中国消费者报南宁讯记者顾艳伟)9月24日至25日,由滇黔桂消费维权联盟轮值单位云南省消费者协会主办的旅游放心消费民宿消费体察活动在云南省腾冲市举办,来自云南、贵州、广西3省自治区)消委会消协)以及部分
「招商邀请」伟业计量第7届经销商现场招商会议正式启动

总统杯无华人历史将终结 李昊桐今年有望参赛

「招商邀请」伟业计量第7届经销商现场招商会议正式启动
伟业计量第7届现场品牌招商会将于7月7日正式启动,专车接送、免费提供星级酒店,诚邀您的参与!1. 邀请对象:经销单位主要负责人2. 会议时间:2023年7月7日3. 会议内容:伟业计量研发基地参观考察
快讯:在线教育盘初快速拉升 高乐股份大涨6%

宁波鄞州:“三大步”整顿网络直播营销

快讯:在线教育盘初快速拉升 高乐股份大涨6%
­中国网财经7月28日讯 在线教育概念股盘初快速拉升,截至发稿,高乐股份、万达信息大涨7%,中国高科、凯美特气、全通教育、天喻信息涨幅均超2%。责任编辑:李晓灵
刺勇大战票价近历史最高 勇士首发轮休球迷哭了

6.2级地震?!在厦大不得不说的体验

刺勇大战票价近历史最高 勇士首发轮休球迷哭了
刺勇大战票价近历史最高 勇士首发轮休球迷哭了发布时间:2019-11-24 09:34 来源:豫都网 我要投稿[摘要]北京时间3月11日,明日马刺勇士将在AT&T中心球馆迎来强强对话,勇士输了森林狼后