突破算力极限!墨芯即将发布全球首款32倍稀疏AI计算卡
2022-03-23
突破算力极限!墨芯即将发布全球首款32倍稀疏AI计算卡
墨芯人工智能 2022-03-23 18:15
2022年3月22日,墨芯人工智能即将发布两款面向云计算市场的AI计算卡:SparseOne™️ S-100和SparseMegatron™️ S-300。
这两款AI计算卡均搭载墨芯首颗AI芯片英腾处理器(ANTOUM),采用墨芯创新技术,突破算力极限。
突破算力极限,性能领先业界
其中SparseMegatron™️ S-300是全球首款32倍稀疏率AI计算卡,运行ResNet50模型时,最高算力达99591FPS;SparseOne™️ S-100最高算力达31031FPS。这意味着其性能在业界首屈一指。
例如运行ResNet50时,SparseOne™️ S-100与业界旗舰产品相比,算力约为后者的6倍,满载情况下功耗不到后者的1/2。
高算力助力客户大幅提高利润率
这两款AI计算卡均面向数据中心AI推理应用,为互联网、运营商和政务安防多类用户提供服务。
对于互联网客户来说,墨芯高性能芯片能够帮助客户提高内容推荐精准度、广告投放精准度。普通消费者在日常生活中经常需要AI芯片提供算力,高性能的芯片能够让社交媒体更懂你心、更精准推荐;在线翻译场景中,墨芯高性能芯片可以让翻译更实时更精准。
AI芯片市场尤其是云端AI芯片市场快速增长,前景广阔。公开资料显示,2020年全球AI芯片市场规模约为101亿美元,年复合增长率达52.1%。其中中国云端AI芯片市场规模为111.7亿元人民币,是AI芯片的主要细分市场。
高算力助力客户大幅降低TCO
随着AI芯片赛道的逐渐成熟,除了技术与产品性能方面的竞争,“商业化落地”方面的考量变得愈发重要。
具体来说,墨芯希望通过降低客户的TCO(单位算力的硬件拥有成本),让客户更愿意使用。TCO主要可以分为两个方面,包括硬件购买成本和使用的能耗成本。
互联网及科技企业对于数据中心的需求非常大,大型的互联网公司每年在数据中心建设方面的投入能够达到数十亿的规模。由于墨芯的计算卡拥有目前GPU的5~10倍的等效算力,在单卡价格相当的情况下,可以大幅降低客户整体的采购成本。
在使用成本方面,墨芯更关注能效比。王维介绍,相较于市场旗舰产品,S-100运行ResNet 50时,每FPS的能效TCO可以降低6倍;运行BERT时,每SPS的能效TCO可以降低10倍,可以有效地降低能耗。
除此之外,客户的使用和迁移成本也较低。墨芯开发的编译器已适配其计算卡,支持通用的AI开发平台TensorFlow、PyTorch或MXNet等。在具体的应用,墨芯软件栈Moffett NNKit 中特有的 Moffett NNCompressor 为客户模型提供 4-32 倍稀疏化压缩能力,客户依旧可以在熟悉的TensorFlow或PyTorch环境里进行开发,方便迁移与交付。
墨芯人工智能为AI时代提供超高性能、超高能效比的AI芯片。采用完全不同于行业现有的芯片架构,墨芯的创新技术优势是:稀疏化算法及芯片架构。2022年1月公司刚完成数亿元A轮融资。
扫码关注墨芯人工智能微信公众号
获取更多信息