由 NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ)
埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作,率先推出推理 AI 智能體,改變工作方式
美國加利福尼亞州圣何塞 —— GTC —— 2025 年 3 月 18 日 —— NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜任務(wù)的高級 AI 智能體。
NVIDIA Llama Nemotron 推理模型系列基于 Llama 模型構(gòu)建,提供按需 AI 推理功能。 NVIDIA 在后訓(xùn)練期間對該推理模型系列進(jìn)行了增強(qiáng),以提升多步數(shù)學(xué)運(yùn)算、編碼、推理和復(fù)雜決策能力。
與基礎(chǔ)模型相比,這種增強(qiáng)過程將模型的精度提高多達(dá) 20%;與其他領(lǐng)先的開放推理模型相比,優(yōu)化推理速度達(dá)到了 5 倍。推理性能的提高意味著模型可處理更復(fù)雜的推理任務(wù),增強(qiáng)決策能力,并降低企業(yè)運(yùn)營成本。
包括{HYPERLINK "https://newsroom.accenture.com/news/2025/accenture-expands-ai-refinery-and-launches-new-industry-agent-solutions-to-accelerate-agentic-ai-adoption" \h}、、Atlassian、{HYPERLINK "https://blog.box.com/box-announces-support-nvidia-llama-nemotron-reasoning-models-box-ai-studio" \h}、{HYPERLINK "https://www.cadence.com/en_US/home/company/newsroom/press-releases/pr/2025/cadence-accelerates-ai-driven-engineering-design-and-science.html" \h}、{HYPERLINK "https://www.crowdstrike.com/en-us/press-releases/crowdstrike-nvidia-agentic-ai-collaboration/" \h}、德勤、、微軟、 和 的領(lǐng)先智能體 AI 平臺, 正在這一全新推理模型和軟件上與 NVIDIA 進(jìn)行合作。
“推理和代理式 AI 的采用速度非常驚人,” NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“NVIDIA 的開放推理模型、軟件和工具為世界各地的開發(fā)者和企業(yè)構(gòu)建高效的代理式 AI 團(tuán)隊(duì)提供了堅(jiān)實(shí)基礎(chǔ)!
NVIDIA 后訓(xùn)練為企業(yè)推理提高準(zhǔn)確性和可靠性
Llama Nemotron 模型系列專為提供生產(chǎn)就緒型 AI 推理而打造,以 NVIDIA NIM™ 微服務(wù)形式提供,包括 Nano、Super 和 Ultra 三種規(guī)模,每種規(guī)模都針對不同部署需求進(jìn)行了優(yōu)化。
Nano 模型可在 PC 和邊緣設(shè)備上提供最高準(zhǔn)確性;Super 模型能夠在單個(gè) GPU 上提供最佳的準(zhǔn)確性和最高的吞吐量;而 Ultra 模型將在多 GPU 服務(wù)器上實(shí)現(xiàn)最高代理準(zhǔn)確性。
NVIDIA 在 上采用高質(zhì)量精選合成數(shù)據(jù)進(jìn)行大量后訓(xùn)練,由 NVIDIA Nemotron™ 模型和其他開源模型,以及 NVIDIA 共同創(chuàng)建的其它精選數(shù)據(jù)集{HYPERLINK "https://blogs.nvidia.cn/blog/nemotron-4-synthetic-data-generation-llm-training/" \h}。
用于開發(fā)模型的工具、數(shù)據(jù)集和后訓(xùn)練優(yōu)化技術(shù)將全面開放,為企業(yè)提供靈活性,以構(gòu)建自己的自定義推理模型。
代理式平臺與 NVIDIA 合作為各行業(yè)增強(qiáng)推理能力
代理式 AI 平臺行業(yè)領(lǐng)導(dǎo)者正在使用 NVIDIA Llama Nemotron 推理模型,為企業(yè)提供先進(jìn)推理能力。
微軟將 Llama Nemotron 推理模型和 NIM 微服務(wù)集成到 Microsoft Azure AI Foundry 中。 此舉擴(kuò)展了 Azure AI Foundry 模型目錄,為客戶提供增強(qiáng)服務(wù)的選項(xiàng),如針對 Microsoft 365 的 Azure AI Agent Service。
SAP 正利用 Llama Nemotron 模型,推動 SAP Business AI 解決方案和 SAP 智能副駕 Joule 的發(fā)展。 此外,它還采用 NVIDIA NIM 和 NVIDIA NeMo™ 微服務(wù),提高了 SAP ABAP 編程語言模型的代碼補(bǔ)全精度。
“我們正在與 NVIDIA 合作,將 Llama Nemotron 推理模型整合到 Joule 中,以增強(qiáng)我們的 AI 智能體,使其更加直觀、準(zhǔn)確且具有成本效益! SAP 全球 AI 負(fù)責(zé)人 Walter Sun 表示,“這些先進(jìn)的推理模型將優(yōu)化和重寫用戶查詢請求,使我們的 AI 能夠更好地理解問題,并提供更智能、更高效的 AI 體驗(yàn),從而推動業(yè)務(wù)創(chuàng)新!
ServiceNow 正利用 Llama Nemotron 模型構(gòu)建 AI 智能體,提供更高的性能和準(zhǔn)確性,從而提升各行各業(yè)的企業(yè)生產(chǎn)力。
埃森哲已經(jīng)在其 AI Refinery 平臺上提供 NVIDIA Llama Nemotron 推理模型,包括{HYPERLINK "https://newsroom.accenture.com/news/2025/accenture-expands-ai-refinery-and-launches-new-industry-agent-solutions-to-accelerate-agentic-ai-adoption" \h}的全新行業(yè)智能體解決方案 —— 可助力客戶快速開發(fā)和部署定制 AI 智能體,以應(yīng)對行業(yè)特定挑戰(zhàn),加速業(yè)務(wù)轉(zhuǎn)型。
德勤計(jì)劃將 Llama Nemotron 推理模型納入其近期發(fā)布的 Zora AI 代理式 AI 平臺,該平臺旨在通過包含深度功能性、特定行業(yè)業(yè)務(wù)知識以及具備透明度的智能體,為人類決策和行動提供支持。
NVIDIA AI Enterprise 為代理式 AI 提供必要工具
開發(fā)者可借助新的 NVIDIA 代理式 AI 工具和軟件,部署 NVIDIA Llama Nemotron 推理模型,簡化高級推理在協(xié)作 AI 系統(tǒng)中的應(yīng)用。
作為 NVIDIA AI Enterprise 軟件平臺的組成部分,最新的代理式 AI 構(gòu)建模塊包括:
NVIDIA AI-Q Blueprint 助力企業(yè)將知識導(dǎo)入可自主感知、推理和行動的 AI 智能體。這一藍(lán)圖由 NVIDIA NIM 微服務(wù)構(gòu)建,集成 NVIDIA NeMo Retriever™ 用于多模態(tài)信息檢索,使用開源 NVIDIA AgentIQ 工具包將智能體和數(shù)據(jù)連接并優(yōu)化,同時(shí)實(shí)現(xiàn)公開透明。
NVIDIA AI 數(shù)據(jù)平臺為新型企業(yè)基礎(chǔ)設(shè)施提供的可定制參考設(shè)計(jì),集成了使用 AI-Q Blueprint 構(gòu)建的 AI 查詢智能體。
為復(fù)雜代理式 AI 應(yīng)用優(yōu)化推理的{HYPERLINK "https://www.nvidia.cn/ai/" \l "referrer=ai-subdomain" \h},可實(shí)現(xiàn)持續(xù)學(xué)習(xí),并實(shí)時(shí)適應(yīng)任意環(huán)境。微服務(wù)可確保對來自領(lǐng)先模型構(gòu)建商,包括 Meta、微軟和 Mistral AI 的最新模型進(jìn)行可靠部署。
NVIDIA NeMo 微服務(wù)提供高效企業(yè)級解決方案,以快速建立并維護(hù)具有魯棒性的數(shù)據(jù)飛輪,讓 AI 智能體持續(xù)學(xué)習(xí)人類和 AI 生成的反饋。用于構(gòu)建數(shù)據(jù)飛輪的 NVIDIA AI Blueprint 為開發(fā)者提供一個(gè)參考架構(gòu),使開發(fā)者可以利用 NVIDIA 微服務(wù)輕松構(gòu)建和優(yōu)化數(shù)據(jù)飛輪。
可用性NVIDIA Llama Nemotron Nano、Super 模型和 NIM 微服務(wù)的托管應(yīng)用編程接口,可通過 和 Hugging Face 獲取。NVIDIA 開發(fā)者計(jì)劃成員可免費(fèi){HYPERLINK "https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317" \h},用于其開發(fā)、測試和研究工作。
企業(yè)可在加速數(shù)據(jù)中心和云基礎(chǔ)設(shè)施上借助 NVIDIA AI Enterprise 在生產(chǎn)環(huán)境中運(yùn)行 Llama Nemotron NIM 微服務(wù)。開發(fā)者可以提前注冊,以便在 NVIDIA NeMo 微服務(wù)發(fā)布時(shí)及時(shí)收到通知。
NVIDIA AI-Q Blueprint 將于 4 月發(fā)布。NVIDIA AgentIQ 工具包現(xiàn)可前往 GitHub 下載。
關(guān)于 NVIDIA