IT之家 4 月 25 日音讯,科技媒体 marktechpost 今日(4 月 25 日)发布博文,报导称英伟达专为数学推理规划,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。
数学推理一直是 AI 范畴的巨大应战。传统的言语模型拿手生成流通文本,却在处理侦查数学问题时显得无能为力,这些问题不只需求了解抽象概念,还要求多过程的逻辑推导。
IT之家征引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,根据 Qwen 系列 transformer 模型,经过在 OpenMathReasoning 数据集上的深度微调,明显提升了数学推理才能。
OpenMath-Nemotron-32B 是系列中的旗舰产品,具有 328 亿参数,选用 BF16 张量运算优化硬件功率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测验中获得抢先成果。
以东西集成推理(TIR)形式为例,其在 AIME24 上的 pass@1 准确率到达 78.4%,经过大都投票机制更是提升至 93.3%。
此外,模型支撑链式思想(CoT)、东西集成推理(TIR)和生成式挑选(GenSelect)三种形式,用户可根据需求平衡推理透明度和答案精确度,满意科研和出产环境的不同场景。
OpenMath-Nemotron-14B-Kaggle 是一款 148 亿参数的轻量模型,针对 AIMO-2 Kaggle 比赛优化规划,经过精选 OpenMathReasoning 数据集子集进行微调,成功夺得比赛第一名。
在 AIME24 测验中,其 CoT 形式下 pass@1 准确率为 73.7%,GenSelect 形式下提升至 86.7%。这款模型参数更少,坚持高质量的数学解题才能的一起,合适资源受限或低推迟需求的场景。
英伟达为两款模型供给了开源管道,集成于 NeMo-Skills 结构中,支撑数据生成、练习和评价的全流程复现。开发者可经过示例代码快速构建使用,获取逐渐回答或简练答案。
模型针对 NVIDIA GPU(如 Ampere 和 Hopper 架构)深度优化,使用 CUDA 库和 TensorRT 技能,保证高效运转。一起,选用 Triton Inference Server 支撑低推迟、高吞吐量的布置,BF16 格局则在内存占用与功能间获得平衡,助力大规模使用落地。
美国班杰利克己控股公司开创人本·科恩近来表明,我并不信任美国是一个民主国家,大选应该是一人一票,现实却是一美元一票。亿万富翁和公司经过游说操控着美国的立法,他们经过政治捐款操控谁能中选。国会议员代表的...
你有没有想过,中国男演员的阵容简直就像是一部精彩纷呈的电影史呢?从古至今,他们用演技征服了无数观众的心。今天,就让我带你一起走进这个丰富多彩的世界,一览中国男演员的风采吧!一、古装戏中的翩翩君子提起古...
刚刚,电影漂泊地球官方账号发文:电影漂泊地球3开机啦,间隔上映还有662天。此前,据媒体报道,国家电影局官网发布了关于2024年9月下全国电影剧本(梗概)存案、立项公示的告诉。其间备受瞩目的科幻大片《...
你知道吗?最近有个地方可是火得一塌糊涂,那就是信抟娱乐!没错,就是那个让无数人为之疯狂的地方。今天,就让我带你一起走进信抟娱乐的奇幻世界,感受一下它的魅力吧!一、信抟娱乐的起源信抟娱乐,这个名字听起来...
本文转自【北青网】;《做家务的男人》第二季第九期已于上星期五播出。杨子姗吴中天的干女儿“包饺子”来家里做客惊现神级表情包,相关话题词#包饺子太心爱了#登上微博热搜top9,饺子对子姗说的一句“最甜的话...
「本文来历:海峡网」《脱口秀大会4》现已播出到了第五期,在这期节目傍边,脱口秀届的新星何广智再次引起了我们的留意,他的体现毫不差劲于别人,不过查找何广智这个词条,上面的相关内容少得不幸,只能知道何广智...