数学
中文大模型测评基准SuperCLUE 发布了数学推理和代码能力两项测评的最新成绩。 **代码能力方面:**腾讯混元T1在项目级代码生成中以77.94分排行国内第二, 领先第三名的QwQ-32B 1.39 分。 **数学推理方面:**腾讯混元T1 以87.31分居国内第二,总分领先GPT o1 、Cl
2025-04-04


中文大模型测评基准SuperCLUE 发布了数学推理和代码能力两项测评的最新成绩。 **代码能力方面:**腾讯混元T1在项目级代码生成中以77.94分排行国内第二, 领先第三名的QwQ-32B 1.39 分。 **数学推理方面:**腾讯混元T1 以87.31分居国内第二,总分领先GPT o1 、Cl