DevOps Specialist – OpenShift & AI Platform (m/w/d) in München & Remote / ZRWA237607
DevOps Specialist – OpenShift & AI Platform (m/w/d) in München & Remote / ZRWA237607
Beschäftigungsart:
Contract
Kontaktname:
Robin Warning
Hinweis:
237607
Für einen unserer Großkunden suchen wir derzeit einen freiberuflichen Mitarbeiter , der die nachfolgenden Anforderungen erfüllt:
Projektbeschreibung:
Für ein langfristiges Plattformprojekt wird ein erfahrener DevOps Specialist gesucht, der den stabilen, sicheren und skalierbaren Betrieb einer modernen Container- und KI-Plattform unterstützt. Die bestehende Systemlandschaft basiert auf der Red Hat OpenShift Container Platform sowie OpenShift AI und wird in einer virtualisierten Infrastruktur betrieben. Ihre Aufgaben:
- Betrieb und Weiterentwicklung einer Machine-Learning- und KI-Plattform auf Basis von OpenShift AI
- Sicherstellung von Stabilität, Sicherheit, Durchsatz und Automatisierung der OpenShift-Containerplattform
- Betrieb und Wartung von NVIDIA-GPU-Ressourcen über VMware vSphere, vGPU/MIG und Container-Orchestrierung
- Planung, Umsetzung und Optimierung von Kubernetes-Deployments, CI/CD-Pipelines sowie Monitoring- und Logging-Lösungen
- Onboarding neuer Projekte in Kubernetes- und Container-Umgebungen
- Kontinuierlicher Ausbau der Plattform (neue Funktionen, Major Upgrades)
- Durchführung regelmäßiger Sicherheitsmaßnahmen (Patching, Hardening, Absicherung der Plattform)
- Bearbeitung von Störungen und Problemen im Tagesbetrieb
- Erstellung von Betriebs- und Architekturkonzepten
- Zusammenarbeit mit Datacenter-, Netzwerk-, Hardware-, Security- und Directory-Teams
- Erstellung von Trainings- und Wissensdokumentation für interne Mitarbeitende sowie individuelle Schulungen
- Beratung interner Stakeholder hinsichtlich Architektur, Betrieb und Weiterentwicklung der Plattform
Ihr Profil:
Mehrjährige Erfahrung mit:
Mehrjährige Erfahrung mit:
- Systemadministration im Enterprise-Umfeld
- Container-Technologien (z. B. CRI-O, Podman)
- Kubernetes / Red Hat OpenShift inkl. Platform Operators
- Betrieb von AI/ML-Komponenten auf Kubernetes-Basis, insbesondere OpenShift AI (Kubeflow, Knative, KServe, ServiceMesh, Model Registry)
- Betrieb von GPU-Ressourcen unter VMware vSphere, OpenShift und OpenShift AI
- Virtualisierungstechnologien (insb. VMware vSphere)
- Storage-Technologien wie iSCSI, NFS, CIFS, Ceph
- Software Defined Networking (Istio, mTLS, L4/7 Load Balancing, Tracing)
- Prometheus Monitoring Stack (Prometheus, Grafana, Alertmanager, Thanos)
- Loki Logging Stack
- Automatisierung von Day-2-Operations
- Konfigurationsmanagement (Kustomize, Helm, Operatoren, CRDs)
- Netzwerkkenntnisse (TCP/IP, DNS, Routing, Firewalls)
- Security-Konzepte inkl. Verschlüsselung, digitale Signaturen, Hardening
- Zugriffs- und Berechtigungskonzepte
- Systemarchitektur und Betrieb verteilter Systeme
- Daten- & Fehleranalyse (Logs, Monitoring-Tools)
- Web-Technologien (HTTP, REST, TLS)
- DevOps-Methoden & Versionskontrolle (Git, GitOps/ArgoCD)
- CI/CD-Pipelines & Deployment-Prozesse
- ITIL- & IT-Service-Management-Kenntnisse
- Mehrjährige Projekterfahrung im Beratungsumfeld für OpenShift- und Containerplattformen
- Mindestens 1 relevantes Kubernetes-Beratungsprojekt innerhalb der letzten 3 Jahre im Bereich der Sozialverwaltung
- Studium (Wirtschaftsinformatik/Informatik) oder vergleichbar
Rahmenparameter:
- Einsatzort: Remote (90%) + München (10%)
- Laufzeit: 01.02.2026 - 31.12.2029
- Auslastung: Vollzeit
Ihr GECO-Ansprechpartner freut sich auf Ihre Kontaktaufnahme und über die Zusendung Ihrer aussagekräftigen Projekthistorie sowie Ihrer Honorarvorstellung.
