拯救你卡顿的DeepSeek！腾讯云上线 TACO 加速版，推理速度狂飙80%

还在为 DeepSeek 推理速度慢、部署麻烦发愁？

腾讯云「高性能应用服务HAI」联手自研计算加速引擎「TACO-LLM」，推出DeepSeek-R1 32B TACO加速版环境！实测多个场景调用性能相较vLLM提升80%，3分钟开箱即用的算力服务，完成环境创建，并使用兼容 openai 的api格式对模型进行调用，企业级AI应用开发效率直接拉满。

TACO-LLM：专业级推理加速引擎

腾讯云TACO-LLM（TencentCloud Accelerated Computing Optimization LLM）作为面向大语言模型的推理加速引擎，通过充分利用计算资源的并行计算能力，为客户提供兼顾高吞吐和低时延的优化方案。

通过三大核心能力重构效能标准：

高易用，无缝迁移：TACO-LLM 设计实现了简单易用的接口，完全兼容业界开源 LLM 推理框架 vLLM。若开发者正在使用 vLLM 作为推理引擎，可以无缝迁移到 TACO-LLM，轻松获得比 vLLM 更优的性能。

多平台，全栈适配：支持国内外多平台生态芯片，一云多芯，多样化高性能算力，全站硬件适配。

高效能，多维加速：集成Continuous Batching动态批处理、Paged Attention显存优化、投机采样等8项核心技术，针对不同的计算资源进行性能优化，全方位提升 LLM 推理计算的效能。

实测效果认证为推理加速「黑科技」

DeepSeek-R1 32B TACO加速版环境，相比于vLLM，可在多个场景提升token吞吐能力，降低生成结果的等待时间，推理流程全面提效。

让我们用实测数据说话：

● 代码生成类场景：使用github数据集来进行测试，相比于vLLM，TACO-LLM在代码生成类场景中token吞吐平均提升 125% 。

请在此添加图片描述