NVIDIA-logo

NVIDIA NeMo chapant

NVIDIA-NeMo-Framework-pwodwi

Espesifikasyon

  • Non pwodwi: NVIDIA NeMo chapant
  • Platfòm ki afekte yo: Windows, Linux, macOS
  • Vèsyon ki afekte yo: Tout vèsyon anvan 24
  • Vulnerabilite sekirite: CVE-2025-23360
  • Nòt Baz Evalyasyon Risk: 7.1 (CVSS v3.1)

Enstriksyon Itilizasyon Pwodwi

Enstalasyon Mizajou Sekirite:
Pou pwoteje sistèm ou a, swiv etap sa yo:

  1. Telechaje dènye lage nan paj NeMo-Framework-Launcher Releases sou GitHub.
  2. Ale nan NVIDIA Product Security pou plis enfòmasyon.

Detay Mizajou Sekirite:
Aktyalizasyon sekirite a adrese yon vilnerabilite nan NVIDIA NeMo Framework ki ta ka mennen nan ekzekisyon kòd ak done tampering.

Lojisyèl ajou:
Si w ap itilize yon lage branch pi bonè, li rekòmande pou ajou ak dènye lage branch lan pou rezoud pwoblèm sekirite a.

Plis paseview

NVIDIA NeMo Framework se yon kad AI jeneratif ki kapab évolutive ak nwaj natif natal ki bati pou chèchè ak devlopè k ap travay sou Gwo modèl lang, Multimodal, ak Lapawòl AI (egzanp Rekonesans lapawòl otomatik epi Tèks-a-Lapawòl). Li pèmèt itilizatè yo kreye, pèsonalize ak deplwaye nouvo modèl AI jenerativ avèk efikasite lè yo pwofite kòd ki egziste deja ak pòs de kontwòl modèl pre-antre.

Enstriksyon EnstalasyonEnstale NeMo Framework

Gwo Modèl Lang ak Modèl Multimodal
NeMo Framework bay sipò bout-a-fen pou devlope Modèl Gwo Lang (LLMs) ak Modèl Multimodal (MMs). Li bay fleksibilite yo dwe itilize sou lokal, nan yon sant done, oswa ak founisè nwaj ou pi pito. Li sipòte tou ekzekisyon sou SLURM oswa Kubernetes pèmèt anviwònman.

_images/nemo-llm-mm-stack.png

Gerizon done
Konsèvate NeMo [1] se yon bibliyotèk Python ki gen ladann yon seri modil pou min done ak jenerasyon done sentetik. Yo évolutive ak optimize pou GPU yo, sa ki fè yo ideyal pou kontwole done lang natirèl pou fòme oswa ajiste LLM yo. Avèk NeMo Curator, ou ka efikasman ekstrè bon jan kalite tèks soti nan anpil kri web sous done yo.

Fòmasyon ak personnalisation

NeMo Framework bay zouti pou fòmasyon efikas ak personnalisation nan LLM yo ak modèl Multimodal. Li gen ladann konfigirasyon default pou konfigirasyon gwoup kalkile, telechaje done, ak ipèparamèt modèl, ki ka ajiste pou antrene sou nouvo seri done ak modèl. Anplis de fòmasyon anvan, NeMo sipòte tou de teknik Sipèvize Fine-Tuning (SFT) ak Parameter Efficient Fine-Tuning (PEFT) teknik tankou LoRA, Ptuning, ak plis ankò.

Gen de opsyon ki disponib pou lanse fòmasyon nan NeMo - lè l sèvi avèk koòdone API NeMo 2.0 oswa avèk NeMo Run.

  • Avèk NeMo Run (Rekòmande): NeMo Run bay yon koòdone pou rasyonalize konfigirasyon, ekzekisyon ak jesyon eksperyans atravè divès anviwònman kalkile. Sa a gen ladan lanse travay sou estasyon travay ou lokalman oswa sou gwo grap - tou de SLURM pèmèt oswa Kubernetes nan yon anviwònman nwaj.
    • Pre-fòmasyon & PEFT Quickstart ak NeMo Run
  • Sèvi ak NeMo 2.0 API: Metòd sa a travay byen ak yon konfigirasyon senp ki enplike ti modèl, oswa si w enterese nan ekri pwòp dataloader koutim ou, bouk fòmasyon, oswa chanje kouch modèl. Li ba ou plis fleksibilite ak kontwòl sou konfigirasyon, epi li fè li fasil pou pwolonje ak Customize konfigirasyon pwogramasyon.
    • Training Quickstart ak NeMo 2.0 API
    • Migrasyon soti nan NeMo 1.0 nan NeMo 2.0 API

Aliyman

  • NeMo-Aligner [1] se yon zouti évolutive pou aliyman modèl efikas. Zouti a gen sipò pou algoritm modèn aliyman modèl tankou SteerLM, DPO, Ranfòsman Aprantisaj nan Feedback Imèn (RLHF), ak plis ankò. Algoritm sa yo pèmèt itilizatè yo fè aliman modèl lang yo vin pi an sekirite, san danje epi itil.
  • Tout pòs NeMo-Aligner yo kwa-konpatib ak ekosistèm NeMo, sa ki pèmèt plis personnalisation ak deplwaman enferans.

Workflow etap pa etap nan tout twa faz RLHF sou yon ti modèl GPT-2B:

  • Fòmasyon SFT
  • Rekonpanse fòmasyon modèl
  • Fòmasyon PPO

Anplis de sa, nou demontre sipò pou plizyè lòt metòd aliyman roman:

  • DPO: yon algorithm aliyman ki lejè konpare ak RLHF ak yon fonksyon pèt ki pi senp.
  • Oto-jwe Fine-Tuning (SPIN)
  • SteerLM: yon teknik ki baze sou kondisyone-SFT, ak pwodiksyon dirije.

Tcheke dokiman an pou plis enfòmasyon: Dokimantasyon aliyman

Modèl multimodal

  • NeMo Framework bay lojisyèl optimize pou fòme ak deplwaye modèl miltimodal modèn nan plizyè kategori: Modèl langaj miltimodal, fondasyon langaj vizyon, modèl tèks-a-imaj, ak pi lwen jenerasyon 2D lè l sèvi avèk Neural Radiance Fields (NeRF).
  • Chak kategori fèt pou satisfè bezwen espesifik ak avansman nan domèn nan, swe modèl dènye kri pou okipe yon pakèt kalite done, tankou tèks, imaj, ak modèl 3D.

Remak
Nou ap imigre sipò pou modèl multimodal soti nan NeMo 1.0 rive nan NeMo 2.0. Si ou vle eksplore domèn sa a nan entre-temps la, tanpri al gade nan dokiman an pou NeMo 24.07 (anvan) lage.

Deplwaman ak Enferans
NeMo Framework bay divès chemen pou enferans LLM, pou satisfè diferan senaryo deplwaman ak bezwen pèfòmans.

Deplwaye ak NVIDIA NIM

  • NeMo Framework entegre ak zouti deplwaman modèl nan nivo antrepriz atravè NVIDIA NIM. Se NVIDIA TensorRT-LLM ki mache ak entegrasyon sa a, ki asire enferans optimize ak évolutive.
  • Pou plis enfòmasyon sou NIM, vizite NVIDIA websit.

Deplwaye ak TensorRT-LLM oswa vLLM

  • NeMo Framework ofri scripts ak API pou ekspòte modèl nan de bibliyotèk optimize enferans, TensorRT-LLM ak vLLM, epi pou deplwaye modèl ekspòte ak NVIDIA Triton Inference Server.
  • Pou senaryo ki mande pèfòmans optimize, modèl NeMo ka ogmante TensorRT-LLM, yon bibliyotèk espesyalize pou akselere ak optimize enferans LLM sou GPU NVIDIA. Pwosesis sa a enplike nan konvèti modèl NeMo nan yon fòma konpatib ak TensorRT-LLM lè l sèvi avèk modil nemo.export.
    • Deplwaman LLM finiview
    • Deplwaye modèl gwo lang NeMo ak NIM
    • Deplwaye modèl gwo lang NeMo ak TensorRT-LLM
    • Deplwaye modèl gwo lang NeMo ak vLLM

Modèl sipòte

Gwo modèl lang

Gwo modèl lang
Gwo modèl lang Preformation & SFT PEFT Aliyman FP8 Fòmasyon Konvèjans TRT/TRTLLM Konvèti nan & soti nan anbrase figi Evalyasyon
Llama3 8B/70B, Llama3.1 405B Wi Wi x Wi (pasyèlman verifye) Wi Tou de Wi
Mixtral 8x7B/8x22B Wi Wi x Wi (pa verifye) Wi Tou de Wi
Nemotron 3 8B Wi x x Wi (pa verifye) x Tou de Wi
Nemotron 4 340B Wi x x Wi (pa verifye) x Tou de Wi
Baichuan2 7B Wi Wi x Wi (pa verifye) x Tou de Wi
ChatGLM3 6B Wi Wi x Wi (pa verifye) x Tou de Wi
Gemma 2B/7B Wi Wi x Wi (pa verifye) Wi Tou de Wi
Gemma2 2B/9B/27B Wi Wi x Wi (pa verifye) x Tou de Wi
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B Wi Wi x Wi (pa verifye) x x Wi
Phi3 mini 4k x Wi x Wi (pa verifye) x x x
Qwen2 0.5B/1.5B/7B/72B Wi Wi x Wi (pa verifye) Wi Tou de Wi
StarCoder 15B Wi Wi x Wi (pa verifye) Wi Tou de Wi
StarCoder2 3B/7B/15B Wi Wi x Wi (pa verifye) Wi Tou de Wi
BERT 110M/340M Wi Wi x Wi (pa verifye) x Tou de x
T5 220M/3B/11B Wi Wi x x x x x

 

Modèl langaj vizyon

Modèl langaj vizyon
Modèl langaj vizyon Preformation & SFT PEFT Aliyman FP8 Fòmasyon Konvèjans TRT/TRTLLM Konvèti nan & soti nan anbrase figi Evalyasyon
NeVA (LLaVA 1.5) Wi Wi x Wi (pa verifye) x Soti nan x
Lama 3.2 Vizyon 11B/90B Wi Wi x Wi (pa verifye) x Soti nan x
LLaVA Next (LLaVA 1.6) Wi Wi x Wi (pa verifye) x Soti nan x

 

Embedding Modèl

Embedding Modèl
Embedding Lang Modèl Preformation & SFT PEFT Aliyman FP8 Fòmasyon Konvèjans TRT/TRTLLM Konvèti nan & soti nan anbrase figi Evalyasyon
SBERT 340M Wi x x Wi (pa verifye) x Tou de x
Lama 3.2 Anrejistre 1B Wi x x Wi (pa verifye) x Tou de x

 

Modèl Fondasyon Mondyal la

Modèl Fondasyon Mondyal la
Modèl Fondasyon Mondyal la Apre Fòmasyon Enferans akselere
Cosmos-1.0-Difizyon-Text2World-7B Wi Wi
Cosmos-1.0-Difizyon-Text2World-14B Wi Wi
Cosmos-1.0-Difizyon-Videyo2World-7B Vini byento Vini byento
Cosmos-1.0-Difizyon-Videyo2World-14B Vini byento Vini byento
Cosmos-1.0-Autoregressive-4B Wi Wi
Cosmos-1.0-Autoregressive-Video2World-5B Vini byento Vini byento
Cosmos-1.0-Autoregressive-12B Wi Wi
Cosmos-1.0-Autoregressive-Video2World-13B Vini byento Vini byento

Remak
NeMo sipòte tou preformation pou tou de difizyon ak achitekti autoregressive text2world modèl fondasyon.

Lapawòl AI

Devlope modèl AI konvèsasyon se yon pwosesis konplèks ki enplike defini, konstwi, ak fòmasyon modèl nan domèn patikilye. Pwosesis sa a anjeneral mande pou plizyè iterasyon yo rive jwenn yon wo nivo de presizyon. Li souvan enplike plizyè iterasyon pou reyalize gwo presizyon, ajisteman sou divès travay ak done espesifik domèn, asire pèfòmans fòmasyon, ak prepare modèl pou deplwaman enferans.

_images/nemo-speech-ai.png

NeMo Framework bay sipò pou fòmasyon ak personnalisation modèl Speech AI. Sa a gen ladan travay tankou rekonesans otomatik lapawòl (ASR) ak sentèz tèks-a-lapawòl (TTS). Li ofri yon tranzisyon lis nan deplwaman pwodiksyon nan nivo antrepriz ak NVIDIA Riva. Pou ede devlopè yo ak chèchè yo, NeMo Framework gen ladann pwen de kontwòl modèn ki pre-antrènman yo, zouti pou tretman done lapawòl ki ka repwodiktif, ak karakteristik pou eksplorasyon entèaktif ak analiz seri done lapawòl yo. Konpozan NeMo Framework pou Speech AI se jan sa a:

Fòmasyon ak personnalisation
NeMo Framework gen tout bagay ki nesesè pou fòme ak pèrsonalize modèl lapawòl (ASRKlasifikasyon LapawòlRekonesans OratèDiarizasyon Oratè, ak TTS) nan yon fason repwodiktif.

SOTA Pre-antrene Modèl

  • NeMo Framework bay resèt dènye kri ak pòs pre-antre nan plizyè ASR epi TTS modèl, osi byen ke enstriksyon sou kòman yo chaje yo.
  • Zouti Lapawòl
  • NeMo Framework bay yon seri zouti itil pou devlope modèl ASR ak TTS, tankou:
    • NeMo Forced Aligner (NFA) pou jenere siy-, mo- ak segman-nivo timestamps nan lapawòl nan odyo lè l sèvi avèk CTC ki baze sou modèl Rekonesans Lapawòl Otomatik NeMo a.
    • Processeur Done Lapawòl (SDP), yon bwat zouti pou senplifye pwosesis done lapawòl. Li pèmèt ou reprezante operasyon pwosesis done nan yon konfigirasyon file, minimize kòd boilerplate ak pèmèt repwodibilite ak pataje.
    • Speech Data Explorer (SDE), yon Dash ki baze sou web aplikasyon pou eksplorasyon entèaktif ak analiz de done lapawòl.
    • Zouti kreyasyon done ki bay fonksyonalite aliman odyo long files ak transkripsyon korespondan yo epi divize yo an fragman ki pi kout ki apwopriye pou fòmasyon modèl Rekonesans Lapawòl Otomatik (ASR).
    • Zouti Konparezon pou Modèl ASR yo konpare prediksyon diferan modèl ASR nan presizyon mo ak nivo ekspresyon.
    • Evalyatè ASR pou evalye pèfòmans nan modèl ASR ak lòt karakteristik tankou Deteksyon Aktivite Vwa.
    • Zouti nòmalizasyon tèks pou konvèti tèks soti nan fòm ekri a nan fòm pale a ak vis vèrsa (egzanp "31yèm" vs "trant premye").
  • Chemen deplwaman
  • Modèl NeMo ki te resevwa fòmasyon oswa Customized lè l sèvi avèk NeMo Framework ka optimize ak deplwaye ak NVIDIA Riva. Riva bay resipyan ak tablo Helm ki fèt espesyalman pou otomatize etap yo pou deplwaman bouton pouse.

Lòt Resous

GitHub Repos
  • NeMo: Depo prensipal la pou chapant NeMo a
  • NeMoKouri: Yon zouti pou konfigirasyon, lanse ak jere eksperyans aprantisaj machin ou yo.
  • NeMo-Aligner: Toolkit évolutive pou aliyman modèl efikas
  • NeMo-Kuratè: Pwosesis pre-pwosesis done ak zouti gerizon pou LLM yo
Jwenn èd
Angaje ak kominote NeMo a, poze kesyon, jwenn sipò, oswa rapòte ensèk yo.
  • Diskisyon NeMo
  • Pwoblèm NeMo

Lang ak kad pwogramasyon

  • Piton: Koòdone prensipal la pou itilize NeMo Framework
  • Pytorch: NeMo Framework bati sou tèt PyTorch

Lisans

  • NeMo Github repo gen lisans anba lisans Apache 2.0
  • NeMo Framework gen lisans dapre AKÒ PWODWI NVIDIA AI. Lè w rale ak itilize veso a, ou aksepte tèm ak kondisyon lisans sa a.
  • Veso Kad NeMo a gen materyèl Llama ki gouvène ak Akò Lisans Kominotè Meta Llama3.

Nòt anba a
Kounye a, sipò NeMo Curator ak NeMo Aligner pou modèl Multimodal se yon travay k ap fèt epi yo pral disponib trè byento.

FAQ

K: Kouman mwen ka tcheke si sistèm mwen an afekte pa vilnerabilite a?
A: Ou ka tcheke si sistèm ou a afekte lè w verifye vèsyon an nan NVIDIA NeMo Framework enstale a. Si li anba vèsyon 24, sistèm ou a ka vilnerab.

K: Ki moun ki rapòte pwoblèm sekirite CVE-2025-23360?
A: Pwoblèm sekirite a te rapòte pa Or Peles - JFrog Security. NVIDIA rekonèt kontribisyon yo.

K: Kouman mwen ka resevwa notifikasyon bilten sekirite nan lavni?
A: Vizite paj NVIDIA Sekirite Pwodwi pou abònman ak notifikasyon bilten sekirite epi rete enfòme sou mizajou sekirite pwodwi yo.

Dokiman / Resous

NVIDIA NeMo chapant [pdfGid Itilizatè
NeMo chapant, NeMo, chapant

Referans

Kite yon kòmantè

Adrès imel ou p ap pibliye. Jaden obligatwa yo make *