# Twentyone — GPU-Hardware & Dev-Services

## AI-Infrastruktur, die dir gehört.

Deine Daten in einer fremden Cloud, dein Modell hinter einer fremden API, deine Kosten schwer planbar. twentyone gibt dir GPU-Hardware aus der Schweiz: bare metal mit Root-Zugriff, gemanagte LLM-Endpoints oder fertige Agents. Du entscheidest, wie viel Betrieb du selbst übernimmst.

- [DGX Spark mieten](/de/dgx-spark)
- [Preise ansehen](/de/preise)

## Drei Ebenen, eine Hardware-Basis

### DGX Spark mieten

Der NVIDIA-AI-Supercomputer mit GB10 und 128 GB Unified Memory, on-demand. Statt die Maschine zu kaufen, mietest du sie, solange du sie brauchst.

[DGX Spark mieten](/de/dgx-spark)

### Bare Metal mit Root

DGX Spark oder H100 als dedizierte Maschine. Voller Root-Zugriff, keine Abstraktionsschicht dazwischen, Schweizer Rechenzentrum.

[Bare Metal GPU](/de/bare-metal)

### Managed Inference

LLM-Endpoints via vLLM, von uns betrieben. OpenAI-kompatible API, ohne dass du dich um Betrieb und Skalierung kümmerst.

[Managed Inference](/de/managed-inference)

### Hermes Agents

Agentische Workloads als gemanagter Dienst. Hermes-Agents auf souveräner Hardware, mit persistentem Gedächtnis und Tool-Use.

[Hermes Agents](/de/agents)

## Warum eigene Hardware statt Hyperscaler

Die meisten AI-Projekte starten auf einer grossen Cloud und merken später, dass drei Dinge fehlen: Datenhoheit, planbare Kosten und Kontrolle über den Stack.

**Deine Daten bleiben in der Schweiz.** Die Hardware steht in einem Schweizer Rechenzentrum. Prompts, Embeddings und Trainingsdaten verlassen die Schweizer Rechtsordnung nicht. Das ist DSG- und DSGVO-konform, ohne dass du es dir zusammenargumentieren musst.

**Kosten, die du vorher kennst.** Du buchst eine Maschine oder einen Endpoint zur Monatspauschale, nicht ein undurchsichtiges Bundle aus Compute, Traffic und Speicher. Kein Bill-Shock am Monatsende.

**Du baust auf einem Stack, den wir selbst betreiben.** Wir vermieten keine Hardware, die wir nur durchreichen. Wir betreiben denselben Stack für unsere eigenen Produkte. Wenn etwas klemmt, kennen wir es.

*Preise*

## Transparent, monatlich abgerechnet

Bare Metal, Managed Inference und Agents rechnen wir monatsweise ab, als planbare Pauschale statt Stundenzähler oder Token-Lotterie. Du siehst die Ansätze, bevor du fragst. Kein „Preis auf Anfrage“.

## Häufige Fragen

### Wo stehen die GPUs?

In einem Rechenzentrum in der Schweiz. Deine Daten verlassen die Schweizer Rechtsordnung nicht.

### Brauche ich eigenes ML-Know-how?

Für Bare Metal ja. Du bekommst Root und baust selbst. Für [Managed Inference](/de/managed-inference) und [Agents](/de/agents) nicht, das betreiben wir für dich.

### Kann ich klein anfangen?

Ja. Du buchst eine Maschine oder einen Endpoint zur Monatspauschale, ohne Hardware zu kaufen und ohne lange Mindestlaufzeit.

### Welche Modelle laufen?

Offene Modelle deiner Wahl über vLLM, OpenAI-kompatibel. Für Agents setzen wir auf Hermes von Nous Research.

## Sag uns, was du vorhast

Egal ob DGX Spark, ein gemanagter Endpoint oder ein Agent. Wir antworten konkret, nicht mit einem Verkaufsgespräch.

[Kontakt aufnehmen](/de/kontakt)