# DGX Spark mieten

Der NVIDIA-AI-Supercomputer für den Schreibtisch — on-demand aus der Schweiz, bare metal oder gemanagt.

## DGX Spark im Überblick

### GB10 Grace Blackwell

NVIDIAs Superchip vereint CPU und Blackwell-GPU auf einem Package. Gebaut für AI-Workloads am Schreibtisch und im Rechenzentrum.

### 128 GB Unified Memory

CPU und GPU teilen sich denselben Speicher. Du lädst grosse Modelle, ohne sie über PCIe hin und her zu schaufeln.

### Bare Metal oder gemanagt

Nimm die Maschine mit vollem Root-Zugriff oder lass uns Endpoints und Agents darauf betreiben.

### Schweizer Rechenzentrum

Die Hardware steht in der Schweiz. Deine Daten bleiben in der Schweizer Rechtsordnung.

*Was kostet das?*

## Was es kostet, DGX Spark zu mieten

Eine DGX Spark zu kaufen bindet Kapital, und die Hardware veraltet, während sie die meiste Zeit ungenutzt steht. Du mietest sie stattdessen, solange dein Projekt läuft.

Wir rechnen monatsweise ab, egal ob du die Maschine bare metal mit Root nimmst oder wir Endpoints darauf betreiben. Eine planbare Pauschale pro Monat statt Stunden-Buchhaltung. Die aktuellen Ansätze stehen auf der [Preisseite](/de/preise).

Was den Preis treibt: ob du die ganze Maschine dediziert brauchst oder dir ein geteilter Inferenz-Endpoint reicht, und wie viel Betrieb du an uns abgibst.

*Passt das zu mir?*

## Wann sich DGX Spark lohnt, und wann nicht

DGX Spark spielt ihre Stärke aus, wenn du grosse, offene Modelle lokal laufen lassen willst. Die 128 GB Unified Memory tragen Modelle, die auf einer normalen Consumer-GPU nicht in den Speicher passen.

Sie ist nicht die richtige Wahl, wenn du nur gelegentlich ein kleines Modell abfragst. Dann reicht ein gemanagter [Endpoint](/de/managed-inference), und du zahlst nicht für eine ganze Maschine.

Sie ist auch nicht das Werkzeug für grosses paralleles Training über viele GPUs. Dafür ist ein [H100-Setup](/de/bare-metal) gebaut. DGX Spark ist die Inferenz- und Entwicklungsmaschine, nicht der Trainings-Cluster.

*Wie unterscheidet sich das?*

## DGX Spark, H100 oder Cloud-GPU

**DGX Spark** ist auf lokale Inferenz grosser Modelle ausgelegt. Unified Memory statt rohem Durchsatz, effizient und souverän.

**H100** liefert die rohe Rechenleistung fürs Training und für hohen Durchsatz. Du nimmst sie, wenn du über viele Tokens pro Sekunde oder über Fine-Tuning redest. Auch sie gibt es bei uns [bare metal](/de/bare-metal).

**Hyperscaler-Cloud** ist flexibel und sofort da, aber deine Daten liegen ausserhalb der Schweiz, und die Kosten sind schwer vorhersehbar. Genau diese drei Punkte löst twentyone anders.

*Habt ihr Beispiele?*

## Wir betreiben DGX Spark selbst

Wir reden nicht über Hardware, die wir nur aus dem Datenblatt kennen. Wir betreiben unsere eigenen Produkte und Agents auf demselben Stack, den wir vermieten.

Das ist unser ehrlichster Beleg: Wir setzen die Maschine im Alltag ein, nicht nur in der Demo. Die Stolpersteine, die wir dabei selbst getroffen haben, fliessen direkt in das ein, was du bei uns bekommst.

*Was empfehlt ihr?*

## Unsere Empfehlung für den Einstieg

Willst du ein offenes Modell souverän betreiben, ohne dich um Betrieb zu kümmern, starte mit einem gemanagten Endpoint und wechsle erst auf eine dedizierte Maschine, wenn die Last es verlangt.

Brauchst du volle Kontrolle über Treiber, Modelle und Daten, nimm die DGX Spark bare metal mit Root.

Der häufigste Fehler: zu früh eine ganze Maschine dediziert mieten, obwohl ein geteilter Endpoint die ersten Monate locker trägt. Wir sagen dir, was zu deinem Workload passt, auch wenn das die kleinere Rechnung ist.

*Preise*

## Monatlich abgerechnet

Ob bare metal mit Root oder gemanagter Endpoint, wir rechnen beides monatsweise ab. Die konkreten Ansätze stehen offen auf der Preisseite.

## Häufige Fragen zu DGX Spark

### Was ist die DGX Spark genau?

Ein kompakter AI-Rechner von NVIDIA mit GB10-Superchip und 128 GB Unified Memory, gebaut, um grosse Modelle lokal laufen zu lassen.

### Bekomme ich die Maschine für mich allein?

Bare metal ja, dann ist sie dediziert und du hast Root. Gemanagt teilst du dir Inferenz-Kapazität und zahlst eine Monatspauschale für die reservierte Leistung.

### Welche Modelle laufen darauf?

Offene Modelle deiner Wahl über vLLM, OpenAI-kompatibel. Für agentische Workloads betreiben wir [Hermes-Agents](/de/agents).

### Kann ich darauf trainieren?

Für Fine-Tuning kleinerer Modelle ja. Für grosses, paralleles Training ist ein [H100-Setup](/de/bare-metal) die bessere Wahl.

## DGX Spark für dein Projekt

Sag uns, welches Modell du betreiben willst. Wir sagen dir, ob bare metal oder gemanagt besser passt.

[Kontakt aufnehmen](/de/kontakt)