财联社11月26日讯(修改 黄君芝)据报道,英伟达(Nvidia)开发了一种新式人工智能(AI)模型,能够发明声响作用,改动人的发音方法,并运用自然言语提示生成音乐。
这个模型被命名为Fugatto,即Foundational Generative Audio Transformer Opus 1,是一个研讨项目。英伟达表明,它不会宣告任何发布这项技能的方案,但它可能会对从音乐、娱乐到翻译服务等职业发生广泛的影响。
英伟达运用深度学习研讨副总裁Bryan Catanzaro在承受采访时表明:“Fugatto最令人兴奋的当地在于,它具有一个模型,你能够要求它以某种方法宣布声响,这真的打开了你对它运用规模的幻想。”
他进一步解说说,市场上的其他模型,有些能够组成语音,有些能够为音乐增加音效,但Fugatto悉数都能够做到。Catanzaro说,能够将其视为视频和图画生成模型(如Stability AI的Stable Video Diffusion或OpenAI的Sora)的一种弥补。
“这儿最基本的改善是……咱们能够运用言语组成音频,我以为,这为人们能够用来发明惊人音频的东西拓荒了新的远景。”他弥补说。
依据英伟达的说法,Fugatto是第一个具有缩短特性的根底模型,这意味着它能够混合经过训练的元素,并遵从“自在方式的指令”。
详细而言,该模型能够经过规范的文字提示生成音频,也能够处理您上传的音频文件。所以,假如你有一个人说话的文件,你能够把那个人的话翻译成另一种言语,一起让它听起来像他的声响。你也能够挑选一个简略的曲调,让它听起来像管弦乐扮演,或许在音乐中增加不同的节拍。
此外,你也能够上传一个文档,让模型用你喜爱的任何声响朗诵。更重要的是,你能够告知模型宣布带有情感重量的声响。
不过,Catanzaro也弥补说,这种模型并不总是完美的。并且,就像生成图画和视频的模型相同,Fugatto也会催生艺术家、音响工程师和相关范畴人员的忧虑。但Catanzaro指出,他的原意是期望这项技能能协助音乐家。
“我期望这是艺术家探究的新东西。”“我以为音频一直是一个富有成效的探究范畴。你知道,当咱们取得新的音频东西时,有时咱们会取得新的音乐方式。”他说。
英伟达CEO黄仁勋表明,这款专为开发者规划的套件经过软件晋级完成了功能腾跃,价格更亲民化,仅249美元(约合人民币1814元),其生成式AI的功能提高高达1.7倍。
与前代产品比较,Jetson Orin Nano Super在功能上完成了70%的提高,每秒可执行惊人的67兆次INT8运算(即67 INT8 TOPS),一起,其内存带宽也大幅提高50%,达到了102GB/s的高速水平。
黄仁勋指出,无论是构建根据检索增强生成(Retrieval-Augmented Generation, RAG)技能的大型言语模型(LLM)谈天机器人,仍是打造视觉AI署理,亦或是布置根据AI的机器人,Jetson Orin Nano Super都能以更低的本钱供给杰出的运算功能,成为开发者的抱负之选。
值得一提的是,这款超级计算机还支撑从7W到25W的功耗运转,适配各种边际设备云算场景,无论是才智城市、才智农业,仍是机器人开发范畴,都能展现出其强壮的使用潜力。
英伟达着重,跟着AI技能从云端向终端的延伸,实体AI将成为未来开展的重要趋势。而Jetson Orin Nano Super不只限于谈天机器人的开发,更在视觉AI署理、AI机器人布置等多个范畴展现出广泛的使用远景。
快科技12月18日音讯,据报道,英伟达推出一款名为“Jetson Orin Nano Super”的生成式人工智能 (AI) 超级电脑。英伟达CEO黄仁勋表明,这款专为开发者规划的套件经过软件晋级完成...
数学推理一直是 AI 范畴的巨大应战。传统的言语模型拿手生成流通文本,却在处理侦查数学问题时显得无能为力,这些问题不只需求了解抽象概念,还要求多过程的逻辑推导。
IT之家征引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,根据 Qwen 系列 transformer 模型,经过在 OpenMathReasoning 数据集上的深度微调,明显提升了数学推理才能。
OpenMath-Nemotron-32B 是系列中的旗舰产品,具有 328 亿参数,选用 BF16 张量运算优化硬件功率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测验中获得抢先成果。
以东西集成推理(TIR)形式为例,其在 AIME24 上的 pass@1 准确率到达 78.4%,经过大都投票机制更是提升至 93.3%。
IT之家 4 月 25 日音讯,科技媒体 marktechpost 今日(4 月 25 日)发布博文,报导称英伟达专为数学推理规划,发布 OpenMath-Nemotron-32B 和 OpenMa...
他表明将全面报导英特尔现有产品,针对机器人、用户使命署理等AI自卖自夸缩短趋势进行优化晋级。
这项应战的艰巨性在于,现在的英伟达(NVDA.O)已不只出售芯片——其事务掩盖从芯片、线缆到软件编译器的整套数据中心解决方案。陈立武周四表明,英特尔将选用相似的系统性战略。
首席财政官大卫·辛斯纳泄漏,短期内英特尔不会进行更多收买。“当时首要使命是瞬间资产负债表,”他着重。此举意味着陈立武终究整合一致AI战略的尽力将首要依托自主研制。
“咱们正采纳整体性战略重塑产品矩阵,使其适配缩短AI作业负载,”陈立武表明,“方针成为客户的首选渠道,这要求咱们完全改造规划与工程理念,提早预判客户需求。”
新任CEO陈立武在其首个英特尔财报电话会议上向分析师勾勒了公司的战略蓝图,一起正告称:“这并非一蹴即至的解决方案。” 他表明将全面报导英特尔现有产品,针对机器人、用户使命署理等AI自卖自夸缩短趋...
1月20日,“湖南首款AI文旅互动玩偶——AI熊猫龙宝产品发布会”在岳阳中华大熊猫苑成功举办。红网时间新闻1月20日讯(记者 罗玲)1月20日,“湖南首款AI文旅互动玩偶——AI熊猫龙宝产品发布会”在...
梦晨 发自 凹非寺量子位 | 大众号 QbitAI谷歌首款AI推理特化版TPU芯片来了,专为深度考虑模型打造。代号Ironwood,也便是TPU v7,FP8峰值算力4614TFlops,功能是201...