首页 > 要闻 > 正文

腾讯混元AI Infra核心技术开源:推理吞吐提升30%

时间:2026-02-04 19:03:30 来源:每日经济新闻


(资料图片仅供参考)

每经AI快讯,2月4日,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

推荐阅读
x 广告
x 广告
精彩推送

Copyright   2015-2022 上市公司网版权所有  备案号:京ICP备12018864号-25   联系邮箱:29 13 23 6 @qq.com