Ausschreibung
KI-Cluster-Upgrade-DGX v2
AusfĂĽhrung:
Bayern
Frist:
Uhr
Leistungsbeschreibung:
<div class="h1">Titel</div>
<div class="pre">KI-Cluster-Upgrade-DGX v2</div>
<div class="h1">Beschreibung</div>
<div class="pre">Auftragsgegenstand ist die Lieferung eines NVIDIA DGX B300 Systems. Für das dtec.bw Projekt MissionLab führte die UniBw M bereits im Jahr 2023 ein Vergabeverfahren für den Ausbau der vorhandenen Deep-Learning Infrastruktur durch. Um die installierte und etablierte Software, einschließlich des Trainings-Software-Frameworks, der Trainingsdaten und bereits vortrainierter neuronaler Netze, weiterverwenden zu können und eine gemein-same und effiziente Nutzung der bisherigen Deep-Learning Workstation zu gewährleisten, waren weitere DGX-H100 Systeme und die entsprechende NVIDIA-Netzwerk-Infrastruktur notwendig. Die UniBw M erteilte am 16.12.2023 nach Durchführung eines Verhandlungsverfahrens ohne Teilnahmewettbewerb ("Lieferung, Installation und Vernetzung eines Deep-Learning-Clusters (NU 187)") den Auftrag durch Zuschlagserteilung an die DELTA Computer Products GmbH (Delta). Aufgrund der Aufträge NU187, MT990, LT218 erhielt die UniBw M im Rahmen des Projekts MissionLab (dtec.bw) einen Deep-Learning-High-Performance-GPU-Cluster. Delta installierte und vernetzte fünf DGX-Systeme auf dem Gelände der UniBw M und integrierte einen High-Performance-/High-Storage-Server. Die UniBw M betreibt nun ein leistungsfähiges System mit 1.120 logischen Rechenkernen (CPUs), zehn Terrabyte Arbeitsspeicher (RAM), 40 NVIDIA H100 Tensor Core GPUs, einer Vernetzung der fünf Server über Infiniband und einem über NVLink angebundenen High-Performance-/High-Storage-Datenserver. Auch die 40 NVIDIA H100 Tensor Core GPUs (DGX-Systeme) sind über NVLink verbunden. Die UniBw M setzt ihren GPU-Cluster unter anderem für das Training von Large-Language-Modellen, die missions-bezogene Planung mittels Reinforcement Learning sowie für das Training von Sensoreinsatzmodellen und die automatisierte Sensorauswertung (Neuronale Netze, Vision Transformer) ein. Die Forschungsarbeiten im Projekt "MissionLab" erzeugen einen stetig wachsenden Bedarf an leistungsfähiger Recheninfrastruktur. Automatisierte Missionssysteme müssen in realitätsnahen Szenarien simuliert, bewertet und weiterentwickelt werden. Diese Untersuchungen basieren auf großen Datenmengen, komplexen KI-Modellen und iterativen Trainingsabläufen, die herkömmliche Serverstrukturen nicht mehr zuverlässig abbilden. Lange Rechenzeiten, begrenzter Grafikspeicher und fehlende Skalierbarkeit würden die Durchführung anspruchsvoller Simulationen sowie das Training moderner KI-Modelle erheblich verlangsamen und damit die Zielsetzung des Projekts gefährden. Ohne das erforderliche Update wären nicht nur die Forschungsziele von MissionLab, sondern auch andere dtec-Projekte gefährdet. Um diese Lücke zu schließen, muss die UniBw M ein System beschaffen, das hohe Rechen- und Speicherlasten dauerhaft tragen kann, eine stabile, zertifizierte KI-Plattform bereitstellt und sich nahtlos in die bestehende Forschungsinfrastruktur integrieren lässt.</div>
<div class="h1">Interne Kennung</div>
<div class="pre">UniBw M dtec.bw PI530</div>
Zusammenfassung:
Tätigkeiten:
Details:
- Auftraggeber
- AusfĂĽhrungsfristen
- Vergabeunterlagen
- Bekanntmachungstext
- Und vieles mehr …
oder:
Id: knw05gZkgL