Der beste Speicher für KI-Workloads ist nicht einfach das schnellste oder größte Speichersystem. Wenn Unternehmen von Pilotprojekten in den Produktivbetrieb übergehen, benötigen sie eine Datenbasis, die Daten in der Nähe der KI-Workloads bereitstellt, verteilte und nicht gekennzeichnete Informationen in eine für KI geeignete Form umwandelt und die Daten bei Training, Inferenz, RAG, Analysen und agentenbasierten Workflows schützt.
- KI hat die Diskussion rund um das Thema Speicher verändert
- Warum herkömmliche Speicherstrategien nicht ausreichen
- Datenbereitschaft ist der erste Test für KI-Speicher
- Die Leistung von KI hängt von den richtigen Daten am richtigen Ort ab
- Die Rolle von AIDP: Platzierung, Verarbeitung und Schutz
- Warum Modularität für die KI-Dateninfrastruktur wichtig ist
- Governance und Sicherheit dürfen nicht erst nachträglich hinzugefügt werden
- Die Datengrundlage für Dell AI Factory with NVIDIA
- Erstellen einer Datengrundlage für skalierbare KI
- Häufig gestellte Fragen
KI hat die Diskussion rund um das Thema Speicher verändert
Speichersysteme werden schon seit langem danach beurteilt, wie gut sie Daten speichern, übertragen und schützen. KI setzt neue Maßstäbe, da Unternehmensdaten viele verschiedene Workload-Arten unterstützen sollen, ohne dass Teams jedes Mal den Kontext neu aufbauen müssen.
In der eSpeaks-Folge „Das Datenproblem, das Ihre KI zum Scheitern bringen könnte“, fasste Vrashank Jain, leitender Produktmanager für die Dell AI Data Platform, die Herausforderung klar und deutlich zusammen: „Es ist kein Problem des Modells mehr, sondern der Datenbereitschaft.“
Für viele Unternehmen besteht die größte Hürde im Bereich der KI nicht in einem Mangel an Daten. Teams benötigen in erster Linie eine zuverlässige Methode, um diese Daten zu finden, aufzubereiten, zu kontrollieren und in einer für KI-Systeme verwertbaren Form bereitzustellen. Inspiriert vom NVIDIA AI Data Platform-Referenzdesign geben KI-Datenplattformen dieser Aufgabe eine klarere Struktur.
Warum herkömmliche Speicherstrategien nicht ausreichen
Herkömmliche Speicherarchitekturen wurden für vorhersehbare Unternehmens-Workloads konzipiert. KI erzeugt eine andere Art von Druck, da Daten möglicherweise mehrere Systeme durchlaufen müssen, bevor sie für ein Modell oder eine Anwendung nutzbar werden.
Unternehmensdaten sind oft über hybride Umgebungen verteilt, von denen jede Daten auf unterschiedliche Weise verarbeitet. Eigenständige Speichersysteme, Data Lakes, Vektordatenbanken und Orchestrierungstools können jeweils einen Teil des KI-Datenproblems lösen. Wenn sie jedoch isoliert betrieben werden, können die Schnittstellen zwischen ihnen zu Silos, inkonsistenten Pipelines, Governance-Lücken und betrieblicher Komplexität führen.
Diese Diskrepanzen treten umso deutlicher zutage, je weiter KI-Anwendungsfälle reifen. Trainingspipelines, Abrufsysteme und agentenbasierte Workflows haben jeweils unterschiedliche Datenanforderungen, die von schnellem Zugriff und aktuellen Indizes bis hin zu Write-Back, Prüfbarkeit und Zugriffskontrollen reichen. Wenn diese Anforderungen auf separate Toolchains zurückgreifen, verbringen Teams mehr Zeit mit der Koordination der Systeme als mit der Weiterentwicklung des Anwendungsfalls.
Pilotprojekte können diese Schwachstellen verbergen, da kleine Teams sich noch auf manuelle Workarounds verlassen können. Im Unternehmensmaßstab versagt derselbe Ansatz jedoch, sofern die Datenumgebung keine wiederholbaren, kontrollierten Workflows unterstützt.
Warnzeichen, die darauf hinweisen, dass eine KI-Speicherumgebung noch nicht produktionsreif ist, sind unter anderem instabile Datenpipelines, manuelle Indexierung oder Anreicherung, uneinheitliche Datenqualität aus verschiedenen Quellen, unklare Datenherkunft, Lücken im Zugriffsverlauf sowie eine unzureichende Auslastung der GPUs aufgrund einer langsamen Datenbereitstellung.
Herkömmlicher Speicher im Vergleich zu AIDP für KI-Workloads
Anforderung | Herkömmlicher Speicher/zugehörige Tools | AIDP-Ansatz |
| Primäre Rolle | Daten in separaten Systemen speichern oder verwalten | Daten über den gesamten KI-Lebenszyklus hinweg unterstützen |
| Datenbereitschaft | Erfolgt oft durch manuelle Aufbereitung oder mit isolierten Tools | Verbindet Speicher mit Aufbereitung, Kontext und Governance |
| Leistung | Optimiert für vorhersehbare Workloads | Berücksichtigt Durchsatz, Parallelität, Datenübertragung und Nähe zur Rechenlösung |
| Governance | Wird über separate Systeme hinweg angewendet | Ist in die Aufbereitung und Verwendung von Daten integriert |
| Skalierung | Eignet sich für Pilotprojekte oder eng gefasste Anwendungsfälle | Unterstützt wiederholbare Workflows für die Unternehmensbereitstellung |
Datenbereitschaft ist der erste Test für KI-Speicher
Daten zu haben ist nicht dasselbe wie über Daten zu verfügen, die für KI nutzbar sind. Teams benötigen ausreichend Kontext, um zu verstehen, woher die Informationen stammen, ob sie aktuell sind und ob sie für den beabsichtigten Anwendungsfall verwendet werden können.
Fehlt dieser Kontext, können Teams Wochen damit verlieren, grundlegende Fragen zu klären, bevor ein Projekt an Dynamik gewinnt. Solide Grundlagen in den Bereichen Katalogisierung und Governance tragen dazu bei, diese Verzögerung zu verringern, da Teams bereits vor einem Stillstand des Projekts beurteilen können, ob die Daten nutzbar sind.
Bei verteilten oder nicht gekennzeichneten Daten besteht der erste Schritt darin, Informationen auffindbar zu machen, ohne dass Teams den Kontext manuell neu erstellen müssen. Die Dell AI Data Platform with NVIDIA unterstützt diese Aufgabe, indem sie Unternehmen dabei hilft, Daten über On-Premise-, Cloud-, Edge-, Anwendungs- und KI-Pipeline-Umgebungen hinweg zu organisieren, zu kennzeichnen, zu indexieren, zu kontrollieren und zu schützen.
Die Leistung von KI hängt von den richtigen Daten am richtigen Ort ab
Die Platzierung von KI-Workloads sollte bei der Datenebene ansetzen: Wo befinden sich die Daten, wie sensibel sind sie, wie schnell benötigt die Workload sie und würde eine Datenverschiebung die Kosten, die Latenz oder das Governance-Risiko erhöhen?
Jain brachte das Thema direkt mit der GPU-Auslastung in Verbindung: „GPUs sind sehr schnell, aber sie sind nur schnell, wenn sie schnell mit Daten gefüttert werden.“
Wenn Rechenressourcen auf Daten warten müssen, laufen Unternehmen Gefahr, einen Teil der teuersten Infrastruktur im KI-Stack nicht voll auszunutzen. Die Leistung hängt vom Speicherort der Daten, ihrer Verschiebung und ihrer Nähe zur Workload ab.
| KI-Workload | Anforderung an die Dateninfrastruktur |
| Training | Zugriff mit hohem Durchsatz auf große Datensätze |
| Feinabstimmung | Aufbereitete, kontrollierte, bereichsspezifische Daten mit klarer Herkunft |
| Inferenz | Abruf mit niedriger Latenz |
| RAG | Indexierung, Aktualität und Zugriff auf den Quelleninhalt |
| Analysen | Umfangreiche Scans und Zugriff auf historische Daten |
| Agentenbasierte Workflows | Write-Back, Prüfbarkeit und Zugriffskontrollen |
Die Workload-Platzierung sollte sich an den Daten orientieren. Die Verlagerung großer Datensätze zwischen Cloud-, Rechenzentrums- und Edge-Umgebungen kann die Verwaltung von Leistung, Kosten und Governance erschweren. Bei sensiblen oder umfangreichen Daten ist es möglicherweise effektiver, die Rechenressourcen näher an den Speicher zu bringen, als die Daten wiederholt zwischen den Umgebungen zu übertragen.
Die Rolle von AIDP: Platzierung, Verarbeitung und Schutz
Mit AIDP können Unternehmen ihre KI-Dateninfrastruktur anhand von drei Kernfunktionen bewerten: Platzierung, Verarbeitung und Schutz. Dell setzt dieses Framework ein, damit Unternehmen feststellen können, ob Daten KI-Anwendungsfälle über den gesamten Lebenszyklus hinweg unterstützen können.
| AIDP-Säule | Bedeutung für KI-Workloads |
| Platzierung | Daten befinden sich dort, wo KI-Workloads effizient darauf zugreifen können, unabhängig davon, ob der Schwerpunkt auf Training, Inferenz, Analyse oder Abruf liegt. |
| Verarbeitung | Strukturierte und unstrukturierte Daten können indexiert, klassifiziert, getaggt, angereichert und für Modelle und Anwendungen aufbereitet werden. Die cuVS-basierte Beschleunigung unterstützt dabei schnellere Workflows für die Vektorsuche und den Datenabruf. |
| Schutz | Zugriffskontrollen, Compliance, Verschlüsselung, Resilienz und Prüfbarkeit bleiben auch dann mit den Daten verbunden, wenn diese KI-Workflows durchlaufen. |
Dell AI Data Platform with NVIDIA wendet dieses Framework mithilfe einer modularen, hybridfähigen Architektur an, die die Datenebene mit der für Enterprise-KI erforderlichen Infrastruktur verbindet.
Warum Modularität für die KI-Dateninfrastruktur wichtig ist
Nur wenige Unternehmen beginnen ihre KI-Modernisierung bei Null. Die meisten benötigen neue KI-Funktionen, die mit bestehenden Datenumgebungen kompatibel sind, anstatt einen kompletten Neuaufbau zu erzwingen.
Durch Modularität können verschiedene Teile der Architektur weiterentwickelt werden, ohne unnötige Abhängigkeiten im gesamten System zu schaffen. Eine Änderung bei Speicher, Verarbeitung oder Schutz sollte keine Engpässe an anderer Stelle verursachen.
Hier kann die AIDP-Lösung dazu beitragen, den Betriebsaufwand zu reduzieren: Sie bietet Teams eine besser koordinierte Möglichkeit, Speicher, Verarbeitung, Governance und Schutz zu verwalten, ohne die Datenstrategie für jede neue KI-Workload neu aufbauen zu müssen.
Offene Standards sind ebenfalls wichtig, da sich KI-Anforderungen ständig ändern. Dell AI Data Platform with NVIDIA unterstützt Standards wie Iceberg und Delta Lake und bietet Teams so mehr Flexibilität für die Weiterentwicklung ihrer Datenumgebungen.
Offen und integriert sind keine Gegensätze. Für den Einsatz von KI in der Produktion benötigen Unternehmen offene Tools und Standards, um Flexibilität zu gewährleisten, sowie eine validierte Infrastruktur, die den Aufwand für den zuverlässigen Betrieb von KI-Workloads in großem Maßstab verringert.
Governance und Sicherheit dürfen nicht erst nachträglich hinzugefügt werden
KI-Systeme nutzen oft sensible Unternehmensdaten, angefangen bei Kundendaten bis hin zu geistigem Eigentum. Da sie zunehmend in geschäftliche Workflows eingebunden werden, kann eine unzureichende Governance ein echtes Risiko darstellen.
Teams benötigen ausreichend Transparenz, um nachzuvollziehen, wie Daten durch einen KI-Workflow fließen, wenn etwas schiefgeht.
Ein RAG-System, das relevante Dokumente bereitstellt, weist ein anderes Risikoprofil auf als ein agentenbasierter Workflow, der Datensätze aktualisieren oder einen Geschäftsprozess auslösen kann. Da KI-Systeme zunehmend nicht mehr nur Daten abrufen, sondern auch Aktionen ausführen, benötigen Unternehmen möglicherweise manipulationssichere Protokolle, granulare Beschränkungen hinsichtlich dessen, was Agenten lesen, schreiben und ausführen dürfen, sowie einen Datenschutz, der sensible Informationen durch die gesamte KI-Pipeline begleitet.
Sicherheit und Resilienz gehören in die KI-Datenarchitektur, nicht daneben.
Die Datengrundlage für Dell AI Factory with NVIDIA
Dell AI Factory with NVIDIA geht von den KI-Ergebnissen aus, die ein Unternehmen erzielen möchte, und verbindet dann die Daten, die Infrastruktur, die Software und die Services, damit diese Ergebnisse produktionsreif werden. Innerhalb dieser umfassenderen Architektur fungiert Dell AI Data Platform with NVIDIA als Datenebene. Sie stellt sicher, dass die Daten für die KI-Workloads dort gespeichert sind, wo sie benötigt werden, dass sie für die Modellnutzung aufbereitet und verwaltet sowie im gesamten Lebenszyklus geschützt sind.
Die NVIDIA-Beschleunigung unterstützt rechenintensive KI-Aufgaben in den Bereichen Training, Inferenz und Abruf, während die Orchestrierungsschicht von Dell dabei hilft, diese Funktionen in validierte Workflows zu integrieren, die Unternehmensteams betreiben und skalieren können.
Erstellen einer Datengrundlage für skalierbare KI
KI hat die Rolle von Speicher in Unternehmen verändert. Beim Wechsel von Pilotprojekten in den Produktivbetrieb müssen die Teams vom Speicher dabei unterstützt werden, Daten im gesamten KI-Lebenszyklus bereitzustellen, zugänglich zu machen, zu kontrollieren und zu schützen. Dell AI Data Platform with NVIDIA bietet Unternehmen die Möglichkeit, diese Herausforderung als Entscheidung für eine Datenplattform anzugehen – und nicht als Anschaffung eines eigenständigen Speichersystems.
Das Ergebnis ist eine Grundlage, die sich ändernde KI-Workloads unterstützen kann und sich gleichzeitig in die umfassendere Dell AI Factory with NVIDIA-Architektur für KI-Ergebnisse in der Produktion einfügt.
Häufig gestellte Fragen
Welcher Speicher ist am besten für KI-Workloads geeignet?
Der beste Speicher für KI-Workloads ist eine Datengrundlage, die Daten im gesamten KI-Lebenszyklus platzieren, verarbeiten, schützen und bereitstellen kann. Unternehmen sollten prüfen, ob der Speicher und die Dateninfrastruktur Training, Feinabstimmung, Inferenz, RAG, Analysen und agentenbasierte Workflows unterstützen können, bevor sie Kapazität und Durchsatz vergleichen oder nur die Kosten betrachten.
Meine Daten befinden sich an vielen verschiedenen Orten und sind nicht gekennzeichnet. Wie kann Dell mir helfen?
Dell AI Data Platform with NVIDIA kann Unternehmen dabei unterstützen, verteilte Daten für KI besser nutzbar zu machen, indem sie Daten in On-Premise-, Cloud-, Edge-, Anwendungs- und KI-Pipeline-Umgebungen organisiert, kennzeichnet, indexiert, kontrolliert und schützt. So können Teams Daten für Training, Inferenz, RAG, Analysen und agentenbasierte Workflows finden, aufbereiten und bereitstellen.
Welche Vorteile bietet die Zusammenarbeit mit Dell bei der Bereitstellung von Enterprise-KI-Lösungen?
Dell unterstützt Unternehmen dabei, Enterprise-KI als Architekturherausforderung zu betrachten und nicht als bloße Anschaffung einer einzelnen Infrastruktur. Dell AI Factory with NVIDIA bietet Teams einen koordinierten Ansatz für die Bereitstellung von KI-Anwendungsfällen, bei dem Leistung, Governance und Skalierbarkeit im Vordergrund stehen.
Wie können Unternehmen den betrieblichen Aufwand für den groß angelegten Einsatz von KI reduzieren?
Der betriebliche Aufwand steigt häufig, wenn Teams zu viele unzusammenhängende Systeme miteinander verknüpfen. AIDP kann diese Belastung verringern, sodass Unternehmen das Datenmanagement über KI-Workflows hinweg besser koordinieren können.
Kann ein Enterprise-Wissensassistent funktionieren, ohne Daten in die Public Cloud zu übertragen?
Ja, je nach Architektur. Bei sensiblen Unternehmensdaten können Unternehmen eine Strategie der Datenlokalität anwenden, bei der Informationen näher an der On-Premise-Infrastruktur oder in kontrollierten Umgebungen verbleiben, gleichzeitig aber der Abruf und die KI-gestützte Suche weiterhin unterstützt werden.
Wie können Unternehmen einen sicheren On-Premise-Wissensassistenten mit RAG entwickeln?
Ein sicherer, RAG-basierter Wissensassistent benötigt einen kontrollierten Zugriff auf den Quelleninhalt, aktuelle Indizes, klare Berechtigungen und Prüfbarkeit. Eine KI-fähige Datenplattform kann diese Anforderungen erfüllen, ohne dabei sensible Informationen in nicht verwaltete Umgebungen zu verlagern.
Sind Sie bereit, KI vom Experimentierstadium in die unternehmensweite Anwendung zu überführen? Entdecken Sie den Enterprise Guide to Scalable AI von TechRepublic, der Ihnen praktische Anleitungen zu Strategie, Daten, Infrastruktur, Anwendungsfällen und ROI bietet.