10 neue KI-Tools im Katalog: Von vLLM bis Wispr Flow — was wir aufgenommen haben und warum

10 neue KI-Tools im Katalog: Von vLLM bis Wispr Flow — was wir aufgenommen haben und warum

Katalog-Update Mai 2026: 10 neue Tools

12. Mai 2026 | Von: KI-Katalog Redaktion

Wir haben diese Woche 10 neue KI-Tools in unseren Katalog aufgenommen. Einige davon nutzen wir selbst, andere haben wir auf Basis von Dokumentation und Community-Feedback recherchiert. Wir sind transparent darüber, was wir aus eigener Erfahrung kennen und was wir bisher nur recherchiert haben — unsere Methodik erklärt das im Detail.

---

Lokale KI-Infrastruktur: 5 neue Tools

Diese Tools sind besonders relevant für Unternehmen, die ihre KI-Infrastruktur lokal und DSGVO-konform betreiben wollen. Wir nutzen einige davon selbst in unserem lokalen KI-Setup mit 2x RTX 3090 Ti.

vLLM — Die Inferenz-Engine hinter unserem KI-Server

Status: Im Einsatz

vLLM ist die Inferenz-Engine, die unseren lokalen KI-Server antreibt. Mit PagedAttention und Tensor-Parallelismus liefert sie 2-4x höheren Durchsatz als Standard-Frameworks. Wir betreiben Qwen 3.6 27B über vLLM auf zwei RTX 3090 Ti und erreichen damit 100-130 Tokens pro Sekunde bei einem Kontextfenster von 127.000 Tokens.

Für wen: Entwickler und Unternehmen, die Open-Source-Modelle produktiv betreiben wollen. Die OpenAI-kompatible API macht Migration von Cloud-APIs einfach.

AnythingLLM — Lokales NotebookLM

Status: Im Einsatz

AnythingLLM ist unsere lokale Alternative zu NotebookLM. Wir laden Verträge, Projektdokumente und interne Wikis hoch und stellen Fragen dazu — komplett lokal, kein Byte verlässt unser Netzwerk. Die RAG-Qualität hängt stark vom verwendeten LLM ab, aber mit Qwen 3.6 sind die Ergebnisse für den Unternehmensalltag absolut brauchbar.

Für wen: Unternehmen, die eine lokale Dokumenten-KI mit voller Datenkontrolle suchen.

Jan AI — ChatGPT für den Desktop, ohne Cloud

Status: Recherchiert

Jan AI ist die einfachste Art, lokale KI zu nutzen: App installieren, Modell auswählen, loschatten. Kein Terminal, keine Konfiguration. Wir haben Jan getestet und finden es ideal für Einsteiger — die Performance liegt allerdings unter Ollama oder vLLM, und es fehlt ein Server-Modus für Teams.

Für wen: Privatanwender und Einsteiger, die lokale KI ohne technische Hürden wollen.

LiteLLM — Ein Proxy für alle KI-Modelle

Status: Recherchiert

LiteLLM löst ein Problem, das jeder kennt, der mehrere KI-Modelle nutzt: Jeder Anbieter hat eine eigene API. LiteLLM vereinheitlicht das — eine Schnittstelle für OpenAI, Anthropic, Mistral, lokale Modelle und 100+ weitere. Besonders spannend für DSGVO: Man kann Routing-Regeln definieren, die sensible Anfragen nur an lokale Modelle senden.

Für wen: Entwickler und Unternehmen mit Multi-Modell-Strategie.

Text Generation WebUI (Oobabooga) — Das Schweizer Taschenmesser

Status: Recherchiert

Text Generation WebUI ist das Tool mit den meisten Einstellungsmöglichkeiten für lokale LLMs. Für Power-User, die jeden Parameter kontrollieren und verschiedene Quantisierungen vergleichen wollen, gibt es nichts Besseres. Für den Unternehmenseinsatz empfehlen wir allerdings Ollama oder vLLM wegen der einfacheren Wartung.

Für wen: Enthusiasten und Forscher, die maximale Kontrolle suchen.

---

Produktivität & Kreativität: 5 neue Tools

Wispr Flow — Diktieren statt Tippen

Status: Recherchiert

Wispr Flow verwandelt gesprochene Sprache in kontextbewussten Text — und zwar überall auf dem Mac. In Slack klingt der Output informell, in E-Mails professionell. Ein spannendes Konzept für alle, die schneller sprechen als tippen. Aktuell leider nur für macOS.

Napkin AI — Text wird zu Diagrammen

Status: Recherchiert

Napkin AI macht etwas, das kein anderes Tool kann: Man fügt Text ein und bekommt automatisch passende Visualisierungen — Flowcharts, Infografiken, Zeitstrahlen. Für Blog-Autoren und Berater ein enormer Zeitsparer.

Krea AI — Echtzeit-Bildgenerierung

Status: Recherchiert

Krea AI unterscheidet sich von Midjourney und DALL-E durch einen Echtzeit-Ansatz: Während man zeichnet oder den Prompt ändert, aktualisiert sich das Bild live. Das ermöglicht einen kreativen Workflow, der sich eher wie Zusammenarbeit anfühlt als wie Prompt-Engineering.

Hume AI — KI mit Emotionsintelligenz

Status: Recherchiert

Hume AI erkennt Emotionen in Sprache und reagiert empathisch — die Stimme wird ruhiger bei frustrierten Nutzern, energischer bei Begeisterung. Primär ein Entwickler-Tool (API), aber das Potenzial für Kundenservice und Companion-Apps ist enorm.

v0.dev (Vercel) — UI-Generierung per Textbeschreibung

Status: Recherchiert

v0.dev generiert aus Textbeschreibungen fertige React-Komponenten mit modernem Design. Für Frontend-Entwickler und Startups, die schnell UI-Prototypen brauchen, ist es eines der produktivsten Tools am Markt.

---

Unsere neue Transparenz-Offensive

Mit diesem Update führen wir ein neues Badge-System ein, das bei jedem Tool klar kennzeichnet, wie tief unsere Bewertung geht:

  • Im Einsatz — Wir nutzen es selbst produktiv (~15 Tools)
  • Recherchiert — Gründlich anhand von Dokumentation und Community-Feedback bewertet (~700 Tools)
  • Katalogisiert — Basisdaten erfasst, Community-Bewertungen willkommen (~1.000 Tools)
Wir glauben: Ehrlich sagen, was man wirklich kennt, ist mehr wert als bei 1.700 Tools so zu tun, als hätte man alles persönlich getestet. Unsere vollständige Methodik findet ihr hier →

Alle 1.700+ KI-Tools durchsuchen: KI-Katalog