Energy Industry

Senior DevOps Engineer – Kafka Architecture & Resiliency (NUR FÜR ANGESTELLTE!)

Berlin GermanyOn-siteAgency contract (e.g. ANÜ)Start date 2/2026Duration 6 months100% workload
Contact person
Cihan Falay
Project ID
2956665
Adobe InDesignArchitectureArchitectural DesignAuthenticationsManagement and Business ConsultingCapacity PlanningDevOpsDisaster RecoveryEngineeringFailoverScalabilityNuclear EngineeringOperationalizationConcept of OperationsPartner Relationship ManagementPerformance TuningQuorumRole-Based Access ControlRecruitment Process OutsourcingWriting DocumentationSecurity PoliciesTopologyVulnerabilityData/Record LoggingAdministrative OperationsKubernetesApache KafkaConfluentMicroservices

Description

Wir, die bridgingIT-Gruppe, sind eine herstellerunabhängige, produktneutrale Technologie- und Unternehmensberatung, die Kunden aus den verschiedensten Branchen bei wegweisenden Veränderungsvorhaben unterstützt.

Immer dann, wenn wir aufgrund von fehlender Kapazität, dennoch unseren Kunden zufrieden stellen möchten, treten wir über unser Partnermanagement an Externe Professionals.

Wir würden uns freuen, Sie schon bald in unserem Partnernetzwerk begrüßen zu dürfen.



Anforderungen
  1. Analyse der bestehenden Kafka-Cluster-Architektur (Topologie, Broker, Replikation, Netzwerk, Kubernetes)
  2. Identifikation von Architektur-, Performance- und Betriebs-Schwachstellen
  3. Ableitung und Dokumentation von Architektur- und Konfigurationsoptimierungen
  4. Konzeption einer hochverfügbaren und skalierbaren Kafka-Architektur (HA & Resiliency)
  5. Multi-Broker- und Multi-Zonen-Setups
  6. Replikations- und Partitionierungsstrategien
  7. Controller- und Quorum-Design (z. B. KRaft)
  8. Bewertung relevanter Failure-Szenarien inkl. Auswirkungen
  9. Erstellung eines HA- und Failover-Konzepts inkl. SLA/SLO-Definition
  10. Erstellung eines Maßnahmenpakets zur Erhöhung der Resiliency
  11. Automatisierte Failover- und Recovery-Strategien
  12. Unterstützung von Cold-Standby- und Disaster-Recovery-Szenarien
  13. Konzeption und Implementierungsbegleitung eines Backup-, Restore- und Disaster-Recovery-Konzepts
  14. Definition von RTO- und RPO-Zielen
  15. Cross-Cluster-Replikation (z. B. MirrorMaker 2)
  16. Durchführung und Dokumentation von DR- und Wiederherstellungstests
  17. Migration der Schema-Verwaltung nach ApiCurio
  18. Konzeption und Umsetzung von Nutzer- und Rechte-Management in Kafka
  19. Berücksichtigung von Security-Aspekten auf Kubernetes-Ebene
  20. Erstellung eines umfassenden Betriebskonzepts
  21. Betriebs-, Support- und Eskalationsprozesse
  22. Monitoring-, Logging- und Alerting-Strategien
  23. Wartungs-, Update- und Patch-Prozesse
  24. Erstellung von Runbooks für Regel- und Störfälle
  25. Umsetzung der Maßnahmen in Zusammenarbeit mit dem internen Projektteam

Muss-Kriterien
  1. mind. 5 Jahre Erfahrung als DevOps Engineer UND 3 Jahre als Kafka-Architekt
  2. Kafka - Backup-, Restore- und Disaster-Recovery-Verfahren (z. B. MirrorMaker 2, Cluster Replication)
  3. Sehr gute Kenntnisse in Kafka Hochverfügbarkeitsumgebungen
  4. Operationalisierung von Apache Kafka als Kerntechnologie
  5. umfangreiches Know-How in Deployments mit ArgoCD und Helm
  6. sehr gute Erfahrungen mit Microservices und Containerorchestration
  7. sehr gute Deutschkenntnisse und English C1
  8. mind. 5 Jahre Erfahrung DevOps Engineering und 3 Jahre Kafka-Architektur
  9. Tiefgehende Kenntnisse in der Architektur von Apache Kafka (Broker, Controller/KRaft, Topics, Partitionen, Replikation).
  10. Erfahrung in Design, Optimierung und Betrieb hochverfügbarer Kafka-Cluster.
  11. Kenntnisse in Performance-Tuning, Kapazitätsplanung und Troubleshooting.
  12. Erfahrung mit Sicherheitskonzepten (TLS, Authentifizierung, Autorisierung, ACLs/RBAC).
  13. Umgang mit Backup-, Restore- und Disaster-Recovery-Verfahren (z. B. MirrorMaker 2, Cluster Replication).
  14. Nachweisliche Erfahrung im Betrieb von Apache Kafka auf Kubernetes.
  15. Kenntnisse gängiger Kafka-Operatoren (z. B. Strimzi, Confluent Operator).
  16. Erfahrung mit StatefulSets, Persistent Volumes, Storage-Klassen und Netzwerk-Policies.
  17. Fundierte Kenntnisse von Kubernetes-Architektur und -Betrieb (Pods, Nodes, Scheduling, Networking).
  18. Erfahrung mit Hochverfügbarkeits- und Multi-Zonen-Setups.
  19. Erfahrung in der Erstellung von Betriebskonzepten und Runbooks.
  20. Erfahrung in technischer Beratung und Architekturdesign.

Melden Sie sich bei Interesse oder Rückfragen jederzeit gerne bei Ihrem Ansprechpartner:

Cihan Falay

Application form