100% Lokal · DSGVO

Jina Embeddings v3

von Jina AI · Lizenz: CC-BY-NC-4.0 · Eingeschränkte Lizenz

Vielseitiges Embedding-Modell mit Task-spezifischen LoRA-Adaptern

4.5 Gesamt

Verfügbare Größen: 572M

ollama run jina/jina-embeddings-v3 Website HuggingFace

Was ist Jina Embeddings v3?

Jina Embeddings v3 ist das neueste Embedding-Modell von Jina AI, einem Berliner KI-Unternehmen, und bietet eine einzigartige Kombination aus Vielseitigkeit und Effizienz. Das Modell mit 572 Millionen Parametern unterstützt eine Kontextlänge von 8192 Tokens und nutzt innovative Task-spezifische LoRA-Adapter, um für verschiedene Anwendungsfälle optimale Embeddings zu erzeugen. Ob Retrieval, Textklassifikation, Clustering oder semantische Ähnlichkeit - Jina v3 waehlt automatisch den passenden Adapter.

Mit Unterstützung für über 100 Sprachen und besonders starker deutscher Performance ist das Modell ideal für den DACH-Markt. Die Matryoshka-Representation-Learning-Technik ermöglicht flexible Embedding-Dimensionen, sodass Nutzer zwischen Qualität und Speicherbedarf abwägen können. Jina v3 laeuft effizient auf CPU und GPU und benötigt minimal nur 2 GB RAM.

Die cc-by-nc-4.0-Lizenz erlaubt die nicht-kommerzielle Nutzung, kommerzielle Lizenzen sind über Jina AI erhältlich. Die Integration ist über die Jina-API, Sentence-Transformers oder direkt über die Transformers-Bibliothek möglich. Für deutschsprachige RAG-Systeme und semantische Suche bietet Jina v3 eine der besten verfügbaren Embedding-Qualitäten bei moderatem Ressourcenverbrauch.

Die Matryoshka-Representation-Learning-Technik erlaubt es, die Embedding-Dimension zwischen 64 und 1024 flexibel zu wählen, was besonders bei großen Dokumentensammlungen Speicher spart. Jina AI als deutsches Unternehmen versteht die besonderen Anforderungen des europäischen Marktes an Datenschutz und DSGVO-Konformität besonders gut.

Fähigkeiten-Matrix

Was kann Jina Embeddings v3 — und was nicht?

🇩🇪 Deutsch-Chat

—

🇬🇧 Englisch-Chat

—

🗣️ Multilingual

—

💻 Code-Generierung

—

🌍 Übersetzung

—

📋 Zusammenfassung

—

📄 RAG / Dokumente

4.5

🔧 Tool-Use / Function Calling

—

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

—

🧮 Mathematik / Logik

—

✍️ Kreatives Schreiben

—

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
572M	4 GB	2 GB	✓ Ja (langsam)	fp16	Jede GPU mit 4GB VRAM, CPU möglich

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✗ LM Studio

✗ llama.cpp

✗ vLLM

✓ Open WebUI

✗ Text Gen WebUI

✗ Jan.ai

Bewertung

Output-Qualität ★★★★☆ 4.5/5

Inference-Speed ★★★★☆ 4.5/5

RAM/VRAM-Effizienz ★★★★☆ 4.5/5

War diese Übersicht hilfreich?