突破算力极限！墨芯即将发布全球首款32倍稀疏AI计算卡

2022-03-23

突破算力极限！墨芯即将发布全球首款32倍稀疏AI计算卡
墨芯人工智能 2022-03-23 18:15

      2022年3月22日，墨芯人工智能即将发布两款面向云计算市场的AI计算卡：SparseOne™️ S-100和SparseMegatron™️ S-300。

      这两款AI计算卡均搭载墨芯首颗AI芯片英腾处理器（ANTOUM），采用墨芯创新技术，突破算力极限。

突破算力极限，性能领先业界

其中SparseMegatron™️ S-300是全球首款32倍稀疏率AI计算卡，运行ResNet50模型时，最高算力达99591FPS；SparseOne™️ S-100最高算力达31031FPS。这意味着其性能在业界首屈一指。

例如运行ResNet50时，SparseOne™️ S-100与业界旗舰产品相比，算力约为后者的6倍，满载情况下功耗不到后者的1/2。

高算力助力客户大幅提高利润率

这两款AI计算卡均面向数据中心AI推理应用，为互联网、运营商和政务安防多类用户提供服务。

对于互联网客户来说，墨芯高性能芯片能够帮助客户提高内容推荐精准度、广告投放精准度。普通消费者在日常生活中经常需要AI芯片提供算力，高性能的芯片能够让社交媒体更懂你心、更精准推荐；在线翻译场景中，墨芯高性能芯片可以让翻译更实时更精准。

AI芯片市场尤其是云端AI芯片市场快速增长，前景广阔。公开资料显示，2020年全球AI芯片市场规模约为101亿美元，年复合增长率达52.1%。其中中国云端AI芯片市场规模为111.7亿元人民币，是AI芯片的主要细分市场。

高算力助力客户大幅降低TCO

随着AI芯片赛道的逐渐成熟，除了技术与产品性能方面的竞争，“商业化落地”方面的考量变得愈发重要。

具体来说，墨芯希望通过降低客户的TCO（单位算力的硬件拥有成本），让客户更愿意使用。TCO主要可以分为两个方面，包括硬件购买成本和使用的能耗成本。

互联网及科技企业对于数据中心的需求非常大，大型的互联网公司每年在数据中心建设方面的投入能够达到数十亿的规模。由于墨芯的计算卡拥有目前GPU的5~10倍的等效算力，在单卡价格相当的情况下，可以大幅降低客户整体的采购成本。

在使用成本方面，墨芯更关注能效比。王维介绍，相较于市场旗舰产品，S-100运行ResNet 50时，每FPS的能效TCO可以降低6倍；运行BERT时，每SPS的能效TCO可以降低10倍，可以有效地降低能耗。

除此之外，客户的使用和迁移成本也较低。墨芯开发的编译器已适配其计算卡，支持通用的AI开发平台TensorFlow、PyTorch或MXNet等。在具体的应用，墨芯软件栈Moffett NNKit 中特有的 Moffett NNCompressor 为客户模型提供 4-32 倍稀疏化压缩能力，客户依旧可以在熟悉的TensorFlow或PyTorch环境里进行开发，方便迁移与交付。

墨芯人工智能为AI时代提供超高性能、超高能效比的AI芯片。采用完全不同于行业现有的芯片架构，墨芯的创新技术优势是：稀疏化算法及芯片架构。2022年1月公司刚完成数亿元A轮融资。

扫码关注墨芯人工智能微信公众号
获取更多信息

返回列表页

突破算力极限！墨芯即将发布全球首款32倍稀疏AI计算卡

2022-03-23

历史新闻

墨芯人工智能连续完成两轮数亿元融资，积极推进稀疏计算生态布局

2024-04-10MORE

中国IC设计Fabless100榜单出炉：墨芯人工智能上榜 Top 10 AI芯片公司

2024-04-02MORE

荣膺殊荣 | 墨芯人工智能斩获“中国IC设计成就奖”之 “极具投资价值IC设计企业奖”

2024-03-29MORE

【2024·AI领先者心声】墨芯人工智能CEO王维：需要重新定义和设计AI计算机

2024-01-12MORE

【人民网权威认证】墨芯S30计算卡喜获“人民匠心产品奖”殊荣

2024-01-02MORE

探索稀疏计算：重塑AI算力技术的新边界

2023-12-20MORE

前中芯国际执行副总裁汤天申博士出任墨芯人工智能执行董事

2023-12-06MORE

墨芯完成智谱大模型适配黄金认证，助推国产算力商业化进程

2023-11-27MORE

高交会焦点：墨芯人工智能软硬件协同解决方案，赋能未来大模型算力

2023-11-17MORE

墨芯 S4/S30 推理加速卡通过 openEuler 社区技术评测

2023-10-30MORE