• 首页
  • 关于我们
  • 产品技术
  • 应用场景
  • 新闻中心
  • 加入我们

千亿级!墨芯公布最新大模型适配成果 @世界人工智能大会

2023-07-06

7月6日,在世界人工智能大会WAIC上,墨芯人工智能发布了大模型算力方案的最新成果,宣告进入“千亿“阶段:墨芯AI计算平台率先支持高达千亿参数的大语言模型,并在吞吐、延时等多项指标上表现优异,创下又一里程碑。

在活动现场,墨芯展台成为全场热点:1760亿参数的大语言模型Bloom在墨芯AI计算平台的推理引擎支持下,能够快速、流畅地回答各类问题,并完成诗歌创作、文案撰写等多项语言生成任务,赢得现场观众的关注与赞叹。


(现场照片)

墨芯在千亿参数大模型上的卓越表现,不仅再次彰显出众的产品技术优势,更是意义重大的行业性突破:
当前,算力瓶颈已成为大模型落地应用的普遍痛点。墨芯针对大模型打造更高性能、更优化的方案,缓解算力之困,为AIGC等大模型应用释放出巨大的应用空间,真正带来“好用”、“用得起”的大模型算力方案。  

这对AIGC产业发展具有重要意义——
表明墨芯能够为行业带来新的空间:将有力助推AIGC等大模型进入多行业应用,为企业、科研机构提供高效的算力支持,加速最新大模型成果走向社会、走向更多行业;同时帮助AI企业建立先发优势,加入AIGC潮流。

一起来了解,墨芯的“千亿时刻“,所包含的重要突破——

行业先发,首屈一指
支持千亿大模型

AIGC背后,是动辄百亿、千亿参数的AI大模型,对算力基础设施带来巨大挑战。
墨芯支持高达千亿参数模型,率先突破行业瓶颈,成为业内为数不多的、能够支持大模型落地的AI芯片企业。


性能优异,加速AIGC
吞吐高达432 token/s

在ChatGPT等在线式AIGC应用中,AI内容生成速度是最关键的指标之一,墨芯的AI计算平台展示出高吞吐、低延时的优势:
在1300亿参数ChatGLM大模型上,8张墨芯S30计算卡吞吐达432 token/s,性能超过主流GPU,大幅加快响应速度,极大地优化了用户体验。

助力AI降本增效
仅用8卡

由于大模型的参数大、内存占用大等问题,一般需要数张、乃至数十张AI计算卡,才能支持百亿、千亿参数大模型推理。
在活动现场,墨芯仅采用8张S30计算卡,就展现出高吞吐、低延时等优异性能,同时功耗远低于旗舰GPU。这意味着能够为AI企业减缓算力基础设施与运营成本压力,达到降本增效的目标。

应用范围广
支持主流大模型

墨芯AI计算平台可支持不同参数级别的大模型,包括 BLOOM、OPT、GPT-X、LLAMA、StableDiffusion等主流大模型,能够为大模型在各行业、各类场景中的应用带来加速。


在WAIC现场,墨芯还展示了MLPerf冠军产品——墨芯AI卡计算卡、AI集成架构方案等众多展品,吸引了众多嘉宾、观众与媒体的好评。

墨芯在千亿参数大模型上的突破,再次显示出稀疏计算的巨大优势,有效解决算力资源不足、功耗等运营成本巨大等行业痛点。墨芯率先将稀疏化算法与硬件结合落地,深度挖掘与释放了稀疏计算在大模型上的潜力与价值,为行业带来大模型算力的“最佳实践“。

这不仅为AI算力的未来发展带来了可行的创新路径,为将来更大模型、更复杂应用的发展奠定基础,更为AIGC等大模型应用的广泛落地打开了空间,为新一轮智能革命提供加速引擎,让AIGC的发展迎来新天地。
返回列表页

历史新闻

  • 再次上榜China Fabless 100榜单,墨芯荣获Top 10 AI芯片公司

    2025-03-28MORE

  • 墨芯S40计算卡完成DeepSeek大模型部署, 支持单卡推理大模型

    2025-02-07MORE

  • 墨芯斩获「2024创业邦100未来独角兽」

    2024-12-23MORE

  • 践行品牌雇主之责|墨芯荣膺2024年第七届「中国人力资源天狼星奖」

    2024-11-28MORE

  • 专访墨芯严恩勖:独创“双稀疏化算法”定义AI芯片架构,通过软硬协同解决算力瓶颈

    2024-09-18MORE

  • 墨芯人工智能入选「2024年度AIGC创新企业榜」

    2024-08-23MORE

  • 2024年Silicon 100榜单出炉!墨芯人工智能荣耀登榜

    2024-07-15MORE

  • 墨芯@WAIC 2024:遇见智能客服的“超级大脑”,体验“硬核四芯”的算力震撼

    2024-07-05MORE

  • 全新征程,焕“芯”启航——墨芯上海公司喜迎乔迁!

    2024-06-17MORE

  • 墨芯人工智能上榜【星辰100】2024AI算力层创新企业奖

    2024-05-17MORE

网站地图
首页 关于我们 产品技术 应用场景 新闻中心 加入我们
联系我们

深圳 (总部) 地址: 深圳市南山区前海金融街1号弘毅大厦9楼 电话: 0755-86700125 上海 | 地址:上海市徐汇区漕宝路650号
桂林高智科技大楼1号楼10层
北京 | 地址:北京市朝阳区融科望京中心
B座2202A
商务合作: sales@moffett.ai 媒体合作: marketing@moffett.ai

关于墨芯

墨芯提供云端和终端AI芯片加速方案,相较于现有产品算力,墨芯产品将带来数量级提升。

Copyright © 2024
墨芯人工智能科技 (深圳) 有限公司
All rights reserved.
粤ICP备2021128059号

微信公众号