• 首页
  • 关于我们
  • 产品技术
  • 应用场景
  • 新闻中心
  • 加入我们

墨芯支持Byte MLPerf,稀疏计算助力AI应用场景

2023-09-04

在大模型趋势下,墨芯通过领先的稀疏计算优势,助力企业加速AI应用,商业化进程接连取得重要突破。近日, AI推理评测ByteMLPerf 公开了墨芯S30计算卡的评测结果。墨芯成为支持ByteMLPerf的供应商之一。


 
墨芯是适配Byte MLPerf(推理)的供应商之一
来源: Byte MLPerf网站
https://github.com/bytedance/ByteMLPerf


 

Byte MLPerf基准套件介绍
来源:https://github.com/bytedance/ByteMLPerf/blob/main/README.md

Byte MlPerf 的评估会分为三个方面,如下:
1. Graph Compiler的易用性、扩展性以及覆盖率;
2. 运行精度评估:包括数值误差和模型跑数据集精度;
3. 运行性能评估:不同场景下的(一般指BS不同)的吞吐和延时表现。

墨芯产品与Byte MLPerf的成功适配,标志着墨芯的商业化进程迈出重要一步,再度印证了稀疏计算在推理性能、能效比等方面的多重优势,展现出墨芯AI计算平台在业务场景中的巨大应用价值。


性能突出,凸显应用价值

基于墨芯独创的双稀疏算法与软硬协同设计,墨芯AI计算平台不仅支持Byte MLPerf 模型库中的多个模型,而且以优秀的性能与高能效比,贴合实际业务场景的需求:

大幅降低TCO,助力企业降本增效:稀疏计算去除了AI计算中的无效元素,因而提升计算效率,墨芯S30计算卡的峰值功耗仅为 250W,意味着降低AI计算过程中的运营成本、基础设施等成本,缓解算力昂贵等业界难题。
应用场景广泛:墨芯AI计算平台支持Byte MLPerf 模型库中的计算机视觉、语音、自然语言处理等多类任务,适用于识别、检测、推荐、AIGC等多种AI应用场景,助力企业拓宽AI业务布局。


软硬协同平台,快速赋能AI落地

墨芯基于性能领先的硬件产品与软件平台,为客户提供企业级端到端的解决方案:墨芯SparseRT™️ 软件开发环境全面支持硬件产品,为快速开发提供了完整的可扩展平台并激活稀疏计算的潜力。同时SparseRT™️ 可以高效支持通用的AI編程框架,如TensorFlow、PyTorch、ONNX和MXNet等。用户可以在熟悉的TensorFlow或PyTorch环境里进行开发之后再进行迁移与交付。

SparseRT™独特的SparseOPT™为AI模型提供4至32倍的稀疏压缩能力,并且易于集成到现有的模型交付流程中,从而充分释放大模型的实时服务潜力。SparseRT™提供可视化性能分析工具,支持离线和实时的模型性能分析,帮助开发人员分析模型中存在的瓶颈,并提供模型部署优化建议,使开发人员能将墨芯的软硬件解决方案几乎零成本集成到现有的基础设施和算法交付中。


墨芯将持续与客户紧密协作,共同探索更多AI应用场景,以创新的AI计算平台与服务,为各行业的智能化升级创造更多价值。



想了解墨芯在Byte MLPerf上的详细性能数据与复现方法,详情参见下方链接:
https://github.com/bytedance/ByteMLPerf/tree/main/byte_mlperf/backends/SPU

返回列表页

历史新闻

  • 再次上榜China Fabless 100榜单,墨芯荣获Top 10 AI芯片公司

    2025-03-28MORE

  • 墨芯S40计算卡完成DeepSeek大模型部署, 支持单卡推理大模型

    2025-02-07MORE

  • 墨芯斩获「2024创业邦100未来独角兽」

    2024-12-23MORE

  • 践行品牌雇主之责|墨芯荣膺2024年第七届「中国人力资源天狼星奖」

    2024-11-28MORE

  • 专访墨芯严恩勖:独创“双稀疏化算法”定义AI芯片架构,通过软硬协同解决算力瓶颈

    2024-09-18MORE

  • 墨芯人工智能入选「2024年度AIGC创新企业榜」

    2024-08-23MORE

  • 2024年Silicon 100榜单出炉!墨芯人工智能荣耀登榜

    2024-07-15MORE

  • 墨芯@WAIC 2024:遇见智能客服的“超级大脑”,体验“硬核四芯”的算力震撼

    2024-07-05MORE

  • 全新征程,焕“芯”启航——墨芯上海公司喜迎乔迁!

    2024-06-17MORE

  • 墨芯人工智能上榜【星辰100】2024AI算力层创新企业奖

    2024-05-17MORE

网站地图
首页 关于我们 产品技术 应用场景 新闻中心 加入我们
联系我们

深圳 (总部) 地址: 深圳市南山区前海金融街1号弘毅大厦9楼 电话: 0755-86700125 上海 | 地址:上海市徐汇区漕宝路650号
桂林高智科技大楼1号楼10层
北京 | 地址:北京市朝阳区融科望京中心
B座2202A
商务合作: sales@moffett.ai 媒体合作: marketing@moffett.ai

关于墨芯

墨芯提供云端和终端AI芯片加速方案,相较于现有产品算力,墨芯产品将带来数量级提升。

Copyright © 2024
墨芯人工智能科技 (深圳) 有限公司
All rights reserved.
粤ICP备2021128059号

微信公众号