数学推理一直是 AI 范畴的巨大应战。传统的言语模型拿手生成流通文本,却在处理侦查数学问题时显得无能为力,这些问题不只需求了解抽象概念,还要求多过程的逻辑推导。
IT之家征引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,根据 Qwen 系列 transformer 模型,经过在 OpenMathReasoning 数据集上的深度微调,明显提升了数学推理才能。
OpenMath-Nemotron-32B 是系列中的旗舰产品,具有 328 亿参数,选用 BF16 张量运算优化硬件功率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测验中获得抢先成果。
以东西集成推理(TIR)形式为例,其在 AIME24 上的 pass@1 准确率到达 78.4%,经过大都投票机制更是提升至 93.3%。