硬汉嵌入式论坛

 找回密码
 立即注册
查看: 359|回复: 3
收起左侧

[客户分享] 微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

[复制链接]

1万

主题

7万

回帖

12万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
121120
QQ
发表于 2026-1-28 15:17:02 | 显示全部楼层 |阅读模式
https://blogs.microsoft.com/blog ... uilt-for-inference/

Maia 200 —— 一款突破性的推理加速器,旨在大幅改善 AI token 生成的经济性。Maia 200 是一款强大的 AI 推理引擎:它采用台积电 3nm 制程打造,配备原生 FP8/FP4 张量核心,重新设计的内存系统,拥有 216GB HBM3e(带宽达 7 TB/s) 和 272MB 片上 SRAM,并结合数据传输引擎,确保超大模型能够持续、高速且高利用率地运行。

这使得 Maia 200 成为所有超大规模云服务商中性能最强的第一方自研芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能也超过了谷歌第七代 TPU。同时,Maia 200 也是微软迄今部署过的最高效推理系统,其每美元性能比当前机群中最新一代硬件提升了 30%。

infographic.png

Maia 200 是我们异构 AI 基础设施的一部分,将服务于多个模型,包括来自 OpenAI 的最新 GPT-5.2 模型,为 Microsoft Foundry 和 Microsoft 365 Copilot 带来更优的性价比优势。微软超级智能(Superintelligence)团队将使用 Maia 200 进行合成数据生成和强化学习,以提升下一代自研模型的能力。
在合成数据流水线场景中,Maia 200 的独特设计有助于加速高质量、特定领域数据的生成与筛选,为下游训练提供更新、更有针对性的信号。

Maia 200 目前已部署在美国中部数据中心区域(爱荷华州得梅因附近),接下来将部署于美国西部 3 区域(亚利桑那州菲尼克斯附近),未来还将扩展到更多区域。Maia 200 与 Azure 实现无缝集成,我们正在预览 Maia SDK,提供一整套用于在 Maia 200 上构建和优化模型的工具。
该 SDK 包含完整能力集,包括 PyTorch 集成、Triton 编译器与优化内核库,以及对 Maia 底层编程语言的访问权限。这使开发者在需要时能够进行细粒度控制,同时也支持在异构硬件加速器之间轻松移植模型。

Maia200chip.png

3.png

4.png

回复

使用道具 举报

7

主题

167

回帖

188

积分

初级会员

积分
188
发表于 2026-1-28 22:24:31 | 显示全部楼层
看不懂,这上面的是机柜?
不知道这么强的算力用来点灯怎么样
回复

使用道具 举报

1万

主题

7万

回帖

12万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
121120
QQ
 楼主| 发表于 2026-1-29 10:29:27 | 显示全部楼层
死不低头 发表于 2026-1-28 22:24
看不懂,这上面的是机柜?
不知道这么强的算力用来点灯怎么样

对,服务机房就是这样的,之前参观过一次深圳超算中心,就是这样的。
回复

使用道具 举报

7

主题

167

回帖

188

积分

初级会员

积分
188
发表于 2026-1-29 12:15:02 | 显示全部楼层
看起来和普通的柜子也没多大区别,做工不怎么行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|硬汉嵌入式论坛

GMT+8, 2026-2-24 07:23 , Processed in 0.056747 second(s), 27 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表