AI-Infrastruktur, die dir gehört.
Deine Daten in einer fremden Cloud, dein Modell hinter einer fremden API, deine Kosten schwer planbar. twentyone gibt dir GPU-Hardware aus der Schweiz: bare metal mit Root-Zugriff, gemanagte LLM-Endpoints oder fertige Agents. Du entscheidest, wie viel Betrieb du selbst übernimmst.
Drei Ebenen, eine Hardware-Basis
DGX Spark mieten
Der NVIDIA-AI-Supercomputer mit GB10 und 128 GB Unified Memory, on-demand. Statt die Maschine zu kaufen, mietest du sie, solange du sie brauchst.
Bare Metal mit Root
DGX Spark oder H100 als dedizierte Maschine. Voller Root-Zugriff, keine Abstraktionsschicht dazwischen, Schweizer Rechenzentrum.
Managed Inference
LLM-Endpoints via vLLM, von uns betrieben. OpenAI-kompatible API, ohne dass du dich um Betrieb und Skalierung kümmerst.
Hermes Agents
Agentische Workloads als gemanagter Dienst. Hermes-Agents auf souveräner Hardware, mit persistentem Gedächtnis und Tool-Use.
Warum eigene Hardware statt Hyperscaler
Die meisten AI-Projekte starten auf einer grossen Cloud und merken später, dass drei Dinge fehlen: Datenhoheit, planbare Kosten und Kontrolle über den Stack.
Deine Daten bleiben in der Schweiz. Die Hardware steht in einem Schweizer Rechenzentrum. Prompts, Embeddings und Trainingsdaten verlassen die Schweizer Rechtsordnung nicht. Das ist DSG- und DSGVO-konform, ohne dass du es dir zusammenargumentieren musst.
Kosten, die du vorher kennst. Du buchst eine Maschine oder einen Endpoint zur Monatspauschale, nicht ein undurchsichtiges Bundle aus Compute, Traffic und Speicher. Kein Bill-Shock am Monatsende.
Du baust auf einem Stack, den wir selbst betreiben. Wir vermieten keine Hardware, die wir nur durchreichen. Wir betreiben denselben Stack für unsere eigenen Produkte. Wenn etwas klemmt, kennen wir es.
Preise
Transparent, monatlich abgerechnet
Bare Metal, Managed Inference und Agents rechnen wir monatsweise ab, als planbare Pauschale statt Stundenzähler oder Token-Lotterie. Du siehst die Ansätze, bevor du fragst. Kein „Preis auf Anfrage“.
Häufige Fragen
- Wo stehen die GPUs?
In einem Rechenzentrum in der Schweiz. Deine Daten verlassen die Schweizer Rechtsordnung nicht.
- Brauche ich eigenes ML-Know-how?
Für Bare Metal ja. Du bekommst Root und baust selbst. Für Managed Inference und Agents nicht, das betreiben wir für dich.
- Kann ich klein anfangen?
Ja. Du buchst eine Maschine oder einen Endpoint zur Monatspauschale, ohne Hardware zu kaufen und ohne lange Mindestlaufzeit.
- Welche Modelle laufen?
Offene Modelle deiner Wahl über vLLM, OpenAI-kompatibel. Für Agents setzen wir auf Hermes von Nous Research.

Jan-Hendrik Heuing
Sag uns, was du vorhast
Egal ob DGX Spark, ein gemanagter Endpoint oder ein Agent. Wir antworten konkret, nicht mit einem Verkaufsgespräch.