NVIDIA News: AI-Optimierung auf RTX-Laptops für DGX Spark sowie neue NVIDIA Nemotron 3 Open-Modelle

Entwickler optimieren LLMs für spezielle Aufgaben, stimmen einen Chatbot auf die Bearbeitung von Produkt-Support-Fragen ab oder entwickeln einen persönlichen Assistenten für die Verwaltung des eigenen Terminkalenders. Viele dieser Arbeitsabläufe werden durch NVIDIA-GPUs vereinfacht, da Entwickler damit mehr Kontrolle, mehr Speicher und schnellere lokale Iterationen erhalten.

Der RTX AI Garage-Blog dieser Woche zeigt, wie man mit Unsloth, einem für NVIDIA-GPUs optimierten Open-Source-Framework, Feinabstimmungen vornimmt. Das reicht von RTX-Laptops bis hin zu DGX Spark, dem kompakten AI-Supercomputer von NVIDIA. Außerdem wird erläutert, wie Entwickler DGX Spark nutzen können, um größere Modelle für komplexere agentenbasierte Workflows zu optimieren. 

NVIDIA stellt außerdem die neu angekündigte NVIDIA Nemotron 3-Familie offener Modelle, Datensätze und Bibliotheken vor, die für eine effiziente, skalierbare Feinabstimmung entwickelt wurden. Nemotron 3 wurde für agentenbasierte AI-Anwendungen entwickelt und ist die bislang leistungsfähigste Reihe offener Modelle von NVIDIA, die Nano-, Super- und Ultra-Größen für unterschiedliche Workloads umfasst.

In der RTX AI Garage dieser Woche gibt es einen kurzen Einblick in die Feinabstimmung, einschließlich:

  • Wichtige Aspekte für die Feinabstimmung, von der parameter-effizienten Einstellung bis zum verstärkenden Lernen, sowie VRAM-Empfehlungen für verschiedene Modellgrößen.
  • Wie Unsloth das Training beschleunigt und gleichzeitig den VRAM-Verbrauch auf NVIDIA-GPUs reduziert.
  • Warum DGX Spark sich durch größere Modelle, erweiterte Kontextfenster und fortschrittliche Workflows auszeichnet.
  • Die neue Nemotron 3-Familie offener Modelle – in den Größen Nano, Super und Ultra – stellt die effizienteste Familie offener Modelle mit führender Genauigkeit dar, ideal für die Entwicklung agentenbasierter AI-Anwendungen. 

Eine praktische Anleitung zur lokalen Feinabstimmung gibt Matthew Berman im folgenden Video, in dem er das Reinforcement Learning auf einer NVIDIA GeForce RTX 5090 mit Unsloth vorführt: https://youtu.be/9t-BAjzBWj8 

So installiert man Unsloth auf NVIDIA DGX Spark. Hier findet man zusätzliche Anleitungen von Unsloth zur Feinabstimmung, um noch heute loszulegen: 

Die Feinabstimmung von Nemotron 3 Nano ist auf Unsloth verfügbar! Nemotron 3 Nano kann jetzt von Hugging Face heruntergeladen oder über Llama.cpp und LM Studio ausprobiert werden.

Weitere Informationen gibt es im RTX AI Garage-Blog

Über Alexander Wittek 5218 Artikel
2012 habe ich es mir zur Aufgabe gemacht meine vielseitigen Erfahrungen nicht nur für mich zu behalten sondern mit euch - den Gamern - zu teilen! Ich spiele seit ich denken kann! Kein Spiel ist vor mir sicher, am liebsten sind mir RPG und Shooter, wie z.B. Destiny, CoD, BF, Mass Effect, Dark Souls, aber auch FIFA und andere Multiplayer-Games halten mich stets bei Laune!

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*


Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.