Nemotron 3 Nano

raspithek.de - Olli Graf
llmCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License . loading=

Nemotron 3 Nano ist ein Modell, dass von NVIDEA trainiert wurde. Es scheint mir ideal, um meinen Orange Pi 5 Plus im Regelbetrieb einzuweihen.

Nemotron 3 Nano

Das Modell steht unter der NVIDIA Open Model License und ist mit 30b Parametern trainiert.

30b

Ich beginne mit dem 30b:latest Modell. Die Daten mit einem Umfang von 24GB passen gut in den Speicher des Orange Pi 5 Plus. Nach gut 66 Minuten erhalte ich eine Antwort, die kleine Fehler enthält.

Die Antwort des 30b:latest Modell
Die Antwort des 30b:latest Modell

30b-a3b-q4_K_M

Mit der Q4_K_M Quantifizierung liefert Nemotron nach 51 Minuten und etwa 57 Sekunden eine Antwort mit nur leichten Fehlern.

Antwort mit Q4_K_M Quantifizierung
Antwort mit Q4_K_M Quantifizierung

a3b-fp16

Auch diese Quantifizierung baut Fehler in die Antwort ein, ist aber nach 51 Minuten und 27 Sekunden fertig.

Antwort von A3B-FP16
Antwort von A3B-FP16

30b-cloud

Diese Modellvariante arbeitet nicht direkt auf meinem Orange Pi 5 Plus sondern in der ollama Cloud. Sie benötigt einen Login und etwas Konfigurationsarbeit. Da ich aber keine Daten in irgendeine Cloud senden möchte, habe ich die Variante nicht weiter betrachtet. Ich gehe davon aus, dass sie sehr viel schneller Antworten liefert, da sie auf richtig potenter Hardware läuft.

Fazit

Nemotron-3 denkt wirklich lange nach, um dann in jeder Variante eine Antwort mit Fehlern zu liefern. Andere Modelle waren allerdings sehr viel fehlerhafter.

Schreibe einen Kommentar

Insert math as
Block
Inline
Additional settings
Formula color
Text color
#333333
Type math using LaTeX
Preview
\({}\)
Nothing to preview
Insert
Creative Commons License
Except where otherwise noted, the content on this site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
raspithek.de - Olli Graf
WordPress Cookie Hinweis von Real Cookie Banner