Wie nützlich ist Chaos Engineering wirklich?

Künstlich generiertes Chaos kann Ihre Infrastruktur härten – oder alles nur noch schlimmer machen.
kirill_makarov | shutterstock.com



Der großangelegte, weltweite Ausfall von Systemen nach einem fehlerhaften Update der Security-Software von Crowdstrike war ein Weckruf für viele Unternehmen. Er machte einerseits klar, dass schon kleine, unbeabsichtigte Fehler dafür sorgen können, dass die Produktivität zum Erliegen kommt. Andererseits sind die Kosten, die das Update-Debakel nach sich zieht, wesentlich umfangreicher als zunächst angenommen.



Im Rahmen von Chaos-Engineering-Initiativen können IT-Systeme mit simulierten Cyberangriffen oder Ausfällen unter Stress gesetzt und getestet werden. Dieses kontrollierte Chaos zu schaffen, ermöglicht es, zu beobachten, wie respektive ob Systeme Störungen standhalten und kann verborgene Schwachstellen aufzeigen, die bei herkömmlichen Tests möglicherweise unter den Tisch fallen. Das kann wiederum dazu beitragen, IT-Infrastrukturen auf unvorhergesehene Ereignisse vorzubereiten und mögliche Ausfallzeiten zu minimieren.  



Die Frage ist dabei nur: Ist Chaos Engineering eine hochmoderne Methode, die für Unternehmen in Sachen Cybersicherheit essenziell ist – oder ist es eher eine gefährliche Ablenkung? Denn auch wenn Chaos Engineering potenziell Einblicke in das Schutzniveau von Systemen gewähren kann, müssen Unternehmen dabei genau prüfen:




wie hoch der Ressourcenbedarf ist,



welche Risiken damit verbunden sind und



ob die Initiative auf umfassendere, strategische Ziele einzahlt.




Je nachdem wie die einzelnen Faktoren ausgestaltet sind, entscheidet sich, ob Chaos Engineering ein sinnvoller (ergänzender) Bestandteil Ihrer Technologiestrategie sein kann. In diesem Artikel werfen wir einen Blick auf die Vor- und Nachteile von Chaos Engineering – und sagen Ihnen, wie Sie herausfinden, ob das etwas für Sie ist oder nicht.



Chaos Engineering – Vorteile



Angenommen, ein großes E-Commerce-Unternehmen möchte Chaos Engineering einsetzen, um die Ausfallsicherheit seines Cloud-Systems während der Haupt-Einkaufszeiten zu untersuchen. Um eine erhöhte Traffic-Last zu erzeugen, kommt ein Chaos-Engineering-Tool zum Einsatz. Das Ziel: „Black Friday“-Bedingungen zu simulieren. Um zu beobachten, wie das System unter Stress reagiert, werden absichtlich Latenzzeiten und zufällige Serverabschaltungen generiert,



Im Rahmen der Tests entdeckt das Team Bottlenecks in der Datenbankarchitektur, die schon bei traditionellen Testing-Methoden hätten auffallen müssen. Mit der Hilfe von Echtzeit-Metriken werden schnell adaptive Strategien implementiert – beispielsweise, um Serverressourcen automatisch zu skalieren und Datenbankabfragen zu optimieren.



Indem diese „Chaos-Experimente“ sukzessive iteriert werden, kann die E-Commerce-Plattform nicht nur den simulierten Unwägbarkeiten standhalten, sondern auch ihre Fähigkeit verbessern, sich automatisch an unerwartete Lastspitzen anzupassen. Das sollte einer nahtlosen Kundenerfahrung in kritischen Absatzzeiträumen zuträglich sein.



Diese proaktive Herangehensweise transformiert das Chaos in eine Chance, die Resilienz der Infrastruktur zu stärken. Zumindest in der Theorie.



Chaos Engineering – Nachteile



Trotz dieser Vorteile stellt Chaos Engineering Anwenderunternehmen wie eingangs bereits erwähnt, vor erhebliche Herausforderungen – und wirft Fragen auf. Insbesondere in den folgenden, vier Bereichen:




Ressourcenintensität. Chaos Engineering zu implementieren, erfordert erhebliche Investitionen in die richtigen Tools sowie qualifiziertes Personal. Essenziell ist außerdem Zeit, um Szenarien möglichst effektiv zu simulieren und zu analysieren. Das kann die Budgets belasten.



Operative Risiken. Absichtlich Fehler einzuführen, birgt Risiken. Chaos Engineering kann potenziell zu Serviceunterbrechungen, Performance-Einbußen und anderen unerwünschten Nebeneffekten führen, die sich negativ auf die Kundenzufriedenheit oder die Finanzen auswirken können.



Schwerpunktverlagerung. Unternehmen legen ihren Fokus oft auf Projekte, die direkt zum Wachstum beitragen und sich durch einen hohen ROI auszeichnen. Chaos Engineering kann von solchen, strategisch wichtigen Initiativen ablenken.



Komplexitätsmanagement. Wenn Unternehmen wachsen, werden ihre Systeme immer komplexer. Chaos Engineering erfordert allerdings ein tiefes Verständnis der den Systemen inhärenten Abhängigkeiten. Diese Komplexitäten könnten Unternehmen davon abhalten, die Prinzipien des Chaos Engineering wirksam anzuwenden.




Die richtige Balance finden



Umfangreich in Chaos Engineering zu investieren, kann sich für einige Unternehmen lohnen – insbesondere in Branchen, in denen Verfügbarkeit und Zuverlässigkeit entscheidend ist. Andere Firmen fahren möglicherweise besser damit, sich darauf zu konzentrieren,




ihre Sicherheitsstandards zu optimieren,



ihre Infrastruktur zu aktualisieren und



Fachkräfte für sich zu gewinnen.




Dabei stellt sich auch die Frage, was die großen Cloud-Anbieter in diesem Bereich künftig anbieten werden. Schließlich entscheiden sich viele Unternehmen für die Public Cloud, um einen Teil der Arbeit – beispielsweise Reliability Engineering – auszulagern.



Letztlich müssen Unternehmen abwägen, wie sich Chaos Engineering in ihre breitere IT-Strategie einfügen kann. Statt das Verfahren einfach pauschal zu übernehmen, empfiehlt es sich, Elemente zu integrieren, die mit den Geschäftszielen in Einklang stehen. So können Unternehmen von den Erkenntnissen profitieren, ohne ihren Fokus für die Kernaufgaben zu verlieren. Anders gesagt: Wie in diversen anderen Bereichen, kommt es auch beim Chaos Engineering darauf an, es mit Bedacht und Plan einzusetzen. (fm)



Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox!

Mehr Nachrichten aus der Umgebung

Heidenau Dohna Stolpen Bannewitz Radeberg Dresden