LakeFS

Git-artige Versionierung für Data Lakes und ML-Datensätze

📋 Katalogisiert 📅 Aktualisiert: 20.05.2026
⭐ Bewertung: ★★★★☆ 4.5/5.0
💰 Preis: Gratis - €500/Monat
📂 Kategorie: Datenanalyse
👁️ Aufrufe: 34
DSGVO-Status: DSGVO-kritisch
Serverstandort: EU (DSGVO-Raum)
AV-Vertrag (DPA): Verfügbar
Datenweitergabe: Unbekannt
Datenlöschung: Unbekannt

Was ist LakeFS?

LakeFS ist eine Open-Source-Plattform, die Git-ähnliche Versionierungsfunktionen — Branches, Commits, Merges und Rollbacks — für Data Lakes und große Datensätze bereitstellt und damit die Reproduzierbarkeit und Governance von Daten-Workflows grundlegend verbessert. Die Plattform arbeitet als transparente Schicht über bestehenden Object-Storage-Systemen wie AWS S3, Azure Blob Storage, Google Cloud Storage und MinIO und erfordert keine Datenmigration oder Formatänderungen. Datenwissenschaftler und -ingenieure können isolierte Branches für Experimente erstellen, Datenänderungen testen und erst nach Validierung in den Haupt-Branch mergen — genau wie bei Code-Versionierung.

Die KI-gestützten Funktionen umfassen automatische Datenqualitäts-Hooks, die vor einem Merge die Datenintegrität, Schema-Konformität und statistische Eigenschaften prüfen. LakeFS bietet nahtlose Integrationen mit dem gesamten modernen Data-Stack: Spark, Trino, Hive, dbt, Airflow, Databricks und Jupyter Notebooks können über das S3-kompatible Gateway ohne Code-Änderungen mit versionierten Daten arbeiten. Die atomare Commit-Semantik gewährleistet konsistente Datensätze selbst bei parallelen Schreibvorgängen, und die Zero-Copy-Branching-Technologie erstellt Branches ohne Datenduplikation, was Speicherkosten minimal hält.

Das Audit-Log dokumentiert alle Datenänderungen für Compliance und Nachvollziehbarkeit. LakeFS ist unter der Apache-2.0-Lizenz Open Source und kann vollständig selbst gehostet werden. LakeFS Cloud bietet gehostetes Management mit Team-Features und Enterprise-Support.

Das Unternehmen hat seinen Sitz in Israel und bietet EU-Cloud-Regionen für DSGVO-konforme Nutzung. Ein vollständiger Auftragsverarbeitungsvertrag ist für Cloud-Kunden verfügbar.

✨ Features & Funktionen

LakeFS bietet 8 leistungsstarke Funktionen:

Git-Versionierung für Daten

Zero-Copy Branching

S3-kompatibles Gateway

Automatische Datenqualitäts-Hooks

Atomare Commits

Spark & Databricks Integration

Audit-Log

Apache 2.0 Open-Source

⚖️ Vor- & Nachteile im Detail

Basierend auf echten Nutzererfahrungen, Tests und Community-Feedback:

✓ Vorteile

  • Git-Workflow für Daten intuitiv
  • Keine Datenmigration nötig
  • Zero-Copy spart Speicherkosten
  • Vollständig Open-Source

✗ Nachteile

  • Konzept erfordert Umdenken im Team
  • Limitiert auf Object Storage
  • Cloud-Features noch im Aufbau

💡 Für wen eignet sich LakeFS?

→ Data-Lake-Änderungen versionieren

→ ML-Datensätze reproduzierbar machen

→ Datenqualität vor Merges validieren

→ Daten-Rollbacks bei Fehlern durchführen

🔄 Alternativen zu LakeFS

Wenn LakeFS nicht das Richtige für dich ist, schau dir diese Alternativen an:

Qlik Sense

Suchgesteuerte BI-Plattform mit assoziativer KI-Engine aus Schweden

★★★★☆ 4.5/5
Details ansehen →

PatSnap Eureka

KI-Patentanalyse und Innovationsforschung für R&D-Teams

★★★★☆ 4.5/5
Details ansehen →

Anomalo

KI-gestützte Datenqualitätsüberwachung für Enterprise-Data-Teams

★★★★☆ 4.5/5
Details ansehen →

Ataccama ONE

Unified Data Trust Platform mit Agentic AI für Datenqualität und Governance

★★★★☆ 4.5/5
Details ansehen →

Fivetran

Automatisierte Datenintegration mit über 600 vorgefertigten Konnektoren

★★★★☆ 4.5/5
Details ansehen →

Airbyte

Open-Source-Datenintegrationsplattform mit über 600 Konnektoren

★★★★☆ 4.5/5
Details ansehen →

Monte Carlo

Data Observability Platform für automatische Erkennung von Datenanomalien

★★★★☆ 4.5/5
Details ansehen →

Prediko

KI-gestützte Bedarfsprognose und Bestandsplanung für Shopify-Händler

★★★★☆ 4.5/5
Details ansehen →

Weights & Biases Prompts

KI-Prompt-Engineering-Plattform für LLM-Evaluation und Monitoring

★★★★☆ 4.5/5
Details ansehen →

Prefect

KI-gestützte Workflow-Orchestrierung für Datenpipelines

★★★★☆ 4.5/5
Details ansehen →

Evidently AI

Open-Source ML-Monitoring für Data Drift und Modellqualität

★★★★☆ 4.5/5
Details ansehen →

NotebookLM

100% GRATIS! Generiert AI-Podcasts aus deinen Docs

★★★★☆ 4.5/5
Details ansehen →

🏁 Unser Fazit zu LakeFS

Klar empfohlen ★★★★☆ 4.5/5

LakeFS gehört zu den besten KI-Tools seiner Kategorie. Die Kombination aus hoher Leistung, gutem Preis-Leistungs-Verhältnis und einsteigerfreundlicher Bedienung macht es zur ersten Wahl für die meisten Anwendungsfälle.

Preisklasse: LakeFS ist mit großzügigem Gratis-Plan – mit 4 klar erkennbaren Stärken und 3 bekannten Schwächen.

Tipp: Vergleiche LakeFS auch mit Qlik Sense, PatSnap Eureka, Anomalo – alles direkte Alternativen in unserer Datenbank.

Quellen & Transparenz

Dieses Tool wurde anhand öffentlich verfügbarer Informationen katalogisiert. Nutzer-Bewertungen sind besonders willkommen:

Externe Links führen zur offiziellen Website des Anbieters. Die genauen URLs zu Pricing und Privacy Policy können abweichen. Letzte Prüfung unserer Bewertung: Mai 2026.

❓ Häufig gestellte Fragen zu LakeFS

War diese Bewertung hilfreich?

Nutzerbewertungen zu LakeFS

Noch keine Bewertungen vorhanden. Sei der Erste!

Deine Erfahrung teilen

Hast du LakeFS selbst genutzt? Hilf anderen mit deiner ehrlichen Bewertung!

Mindestens 20, maximal 2.000 Zeichen
Bewertungen werden nach kurzer Prüfung veröffentlicht. Kein Account nötig.