news 2026/4/3 1:55:17

微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

https://blogs.microsoft.com/blog ... uilt-for-inference/

Maia 200 —— 一款突破性的推理加速器,旨在大幅改善 AI token 生成的经济性。Maia 200 是一款强大的 AI 推理引擎:它采用台积电 3nm 制程打造,配备原生 FP8/FP4 张量核心,重新设计的内存系统,拥有 216GB HBM3e(带宽达 7 TB/s) 和 272MB 片上 SRAM,并结合数据传输引擎,确保超大模型能够持续、高速且高利用率地运行。

这使得 Maia 200 成为所有超大规模云服务商中性能最强的第一方自研芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能也超过了谷歌第七代 TPU。同时,Maia 200 也是微软迄今部署过的最高效推理系统,其每美元性能比当前机群中最新一代硬件提升了 30%。


Maia 200 是我们异构 AI 基础设施的一部分,将服务于多个模型,包括来自 OpenAI 的最新 GPT-5.2 模型,为 Microsoft Foundry 和 Microsoft 365 Copilot 带来更优的性价比优势。微软超级智能(Superintelligence)团队将使用 Maia 200 进行合成数据生成和强化学习,以提升下一代自研模型的能力。
在合成数据流水线场景中,Maia 200 的独特设计有助于加速高质量、特定领域数据的生成与筛选,为下游训练提供更新、更有针对性的信号。

Maia 200 目前已部署在美国中部数据中心区域(爱荷华州得梅因附近),接下来将部署于美国西部 3 区域(亚利桑那州菲尼克斯附近),未来还将扩展到更多区域。Maia 200 与 Azure 实现无缝集成,我们正在预览 Maia SDK,提供一整套用于在 Maia 200 上构建和优化模型的工具。
该 SDK 包含完整能力集,包括 PyTorch 集成、Triton 编译器与优化内核库,以及对 Maia 底层编程语言的访问权限。这使开发者在需要时能够进行细粒度控制,同时也支持在异构硬件加速器之间轻松移植模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 16:02:45

系统挂死在DPC的深度诊断:Windows内核分析指南

引言在Windows系统管理和故障排查的工作中,我们经常会遇到一类特殊的系统问题:系统似乎在运行,但完全无响应,键盘鼠标无法操作,网络连接中断,这种现象被称为"系统挂死"。其中一个常见的原因就是系…

作者头像 李华
网站建设 2026/4/1 1:34:29

拆解 Moltbot:一个”本地优先”的 AI 助手,到底是怎么跑起来的?

拆解 Moltbot:一个”本地优先”的 AI 助手,到底是怎么跑起来的?2026-01-28大多数人对 AI 助手的想象还停留在”聊天框问一句答一句”。但如果你想让 AI 真正融入日常——跨平台、跨设备、能调工具、还不被陌生人劫持——事情就复杂了。本文拆…

作者头像 李华
网站建设 2026/4/1 22:27:51

基于有限体积法的二维不可压缩NS方程MATLAB求解

一、MATLAB核心代码实现 1. 网格初始化 %% 参数设置 nx 50; ny 50; % 网格数 lx 1.0; ly 1.0; % 计算域尺寸 nu 0.01; % 动力粘度 Uin 1.0; % 入口速度 Re 1000; % 雷诺数 dt 0.001; …

作者头像 李华
网站建设 2026/3/30 12:31:08

3607. 打印日期

3607. 打印日期 ⭐️难度&#xff1a;简单 ⭐️类型&#xff1a;模拟 &#x1f4d6;题目&#xff1a;题目链接 &#x1f4da;题解&#xff1a; 利用好NextDay函数。 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<string.h> #include<vector…

作者头像 李华
网站建设 2026/3/15 3:40:11

鸿蒙 HarmonyOS 6 | 系统能力 (06) 构建现代化通知体系 从基础消息到实况

文章目录 前言一、 通道管理 通知的分类与权限基石1. Slot 类型与应用场景2. 初始化通道的代码实现3. 配置说明 二、 基础通知 ID 管理与内容构建1. ID 的作用与策略2. 基础文本通知实现 三、 动态更新 进度条通知与节流策略1. 性能陷阱&#xff1a;高频更新2. 解决方案&#x…

作者头像 李华