NVIDIA NeMo 通过 AutoModel 功能增强 Hugging Face 模型集成
By: blockchain news|2025/05/13 15:45:04
0
分享
NVIDIA 推出了 NeMo 框架的重大增强,推出了 AutoModel 功能,旨在简化 Hugging Face 模型的集成和微调。根据 NVIDIA 官方博客 的说法,该开发旨在支持最先进模型的 Day-0 支持,使组织能够高效利用生成式 AI 的最新进展。 AutoModel:模型集成的新纪元 AutoModel 功能作为 NeMo 框架内的高级接口,允许用户轻松微调来自 Hugging Face 的预训练模型。起初涵盖文本生成和视觉语言模型,AutoModel 计划扩展到视频生成和其他分类。该功能简化了模型并行的过程,通过 JIT 编译增强 PyTorch 性能,并确保无缝过渡到由 NVIDIA Megatron-Core 提供支持的最佳训练和后训练方案。 AutoModel 的引入解决了将新模型架构集成到 NeMo 框架中的挑战,提供了利用 Hugging Face 庞大模型库的简单途径。该功能通过完全分片的数据并行 2 (FSDP2) 和分布式数据并行 (DDP) 支持模型并行,未来扩展包括张量并行 (TP) 和上下文并行 (CP)。 高效训练和可扩展性 AutoModel 接口启用开箱即用的模型并行和增强的 PyTorch 性能,允许组织高效扩展它们的 AI 解决方案。集成使导出至 vLLM 进行优化推理变得轻而易举,计划很快引入 NVIDIA TensorRT-LLM 导出。这确保了组织能够维持高吞吐量和可扩展性,这对于竞争激烈的 AI 领域至关重要。 AutoModel 还提供了无缝的“选择加入”高性能 Megatron-core 路径,允许用户通过最小化代码修改切换到优化训练。一致的 API 确保了对 Megatron-Core 支持路径的最大吞吐量过渡是简单的。 扩展 NeMo 的能力 AutoModel 的引入是 NVIDIA 增强 NeMo 框架能力的更广泛战略的一部分。该功能不仅支持文本生成的 AutoModelForCausalLM 类,还允许开发人员通过创建子类来扩展对其他任务的支持,从而拓宽 AI 应用的范围。 随着 NeMo 框架 25.02 的发布,鼓励开发人员通过 NVIDIA 的 GitHub 仓库提供的教程笔记本探索 AutoModel。社区也被邀请提供反馈并为 AutoModel 功能的持续开发做出贡献,以确保其持续演变以满足尖端 AI 研究和开发的需求。 随着 AI 领域的快速发展,NVIDIA 的 NeMo 框架及其 AutoModel 功能,将自身定位为组织寻求最大化生成 AI 模型潜力的关键工具。通过实现无缝集成和优化性能,NeMo 框架使团队能够始终站在 AI 创新的前沿。 nvidia ai 模型 hugging face nemo 框架
猜你喜欢

Stripe 年度信:新认知密度极高,特别是“AI+支付”的 5 级模型
这里面的每一个趋势,都在影响大家未来的生死存亡。

Sam Altman的二十四小时:五角大楼说了两次「不」,但只对一个人是认真的
在硅谷,Altman这不到十二小时的操作有个名字。不叫背刺,叫timing。

美国和伊朗战火已经烧到了币圈,周一市场有哪些预期
币圈最重要的产业,距离导弹落点只有300公里

Solana 基金会主席 Lily Liu 喊出“别在 crypto 浪费时间”,加密行业真已死?
年轻一代的兴趣正在从加密货币向人工智能领域迁移,这与当前加密行业的现象不谋而合。

世界属于会说英文的中国人
世界很大,只玩一半实在太亏了。

比特小鹿们逐水草而居
矿企从来不是比特币最虔诚的信仰者,在减半压缩利润、财报增收不增利、币价跌破挖矿成本等压力之下,行业集体去风险化。

Virtuals Protocol首个Titan项目:ROBO要给机器人一个钱包
这是 Virtuals 将 Agent 经济向具身 AI 和机器人领域扩展的重要一步。

稳定币最新报告:真实分布和流向远比供应量值得关注
供应量翻倍之后,稳定币的流通速度、集中度与结构真相。

Paradigm 的新算术:当 crypto 装不下 127 亿,AI 成为答案
从 FTX 的废墟里走出来,Paradigm 用了三年时间。

Dune 稳定币研究:一个 3000 亿美元市场的流动与需求
在数据集中,转账不再仅仅被标记为单纯的“交易量”,而是被分类为不同的链上活动。这就是“仅仅知道有 10 万亿美元被转移”与“理解它为什么被转移”之间的区别。

Wintermute创始人:在迷失的加密市场,我们还能做什么?
这更像是一篇宣言,说说「我们到底为什么在这」。

13亿的债务:比特小鹿有一场硬仗要打
吴忌寒在等AI的钱,追上债务的速度。

Anthropic的IPO豪赌:在最不该说不的时刻,它偏偏说了不
AI纪元里,最宝贵的东西是什么?

Paradigm的算术题:127亿美元,装不进一个crypto基金
从FTX的废墟里走出来,Paradigm用了三年时间

以太坊发布扩容路线图,这次有何不同?
短期通过Gas机制优化、区块验证并行化等技术改进提升执行效率,长期则依靠 ZK-EVM 与 blobs 数据架构推动网络规模提升

Anthropic封禁风波、OpenAI千亿融资争议,海外币圈今天在聊啥?
过去24小时里,老外最关心的是什么?

为何止步于12.6万?Michael Saylor拆解BTC停滞与散户缺席真相
比特币是数字资本,我会花一千小时向你解释,你最终会听懂,但你仍要忍受 45% 的暴跌。

早报 | OpenAI 获得 1100 亿美元投资;Solana 推出 Solana Payments;M0、MoonPay、PayPal 共同推出 PYUSDx
2 月 27 日市场重要事件一览
Stripe 年度信:新认知密度极高,特别是“AI+支付”的 5 级模型
这里面的每一个趋势,都在影响大家未来的生死存亡。
Sam Altman的二十四小时:五角大楼说了两次「不」,但只对一个人是认真的
在硅谷,Altman这不到十二小时的操作有个名字。不叫背刺,叫timing。
美国和伊朗战火已经烧到了币圈,周一市场有哪些预期
币圈最重要的产业,距离导弹落点只有300公里
Solana 基金会主席 Lily Liu 喊出“别在 crypto 浪费时间”,加密行业真已死?
年轻一代的兴趣正在从加密货币向人工智能领域迁移,这与当前加密行业的现象不谋而合。
世界属于会说英文的中国人
世界很大,只玩一半实在太亏了。
比特小鹿们逐水草而居
矿企从来不是比特币最虔诚的信仰者,在减半压缩利润、财报增收不增利、币价跌破挖矿成本等压力之下,行业集体去风险化。