Unsere Untersuchungen haben ergeben, dass die meisten Unternehmen zwar mehrere öffentliche Clouds oder eine Form der Hybrid-Cloud-Implementierung nutzen, dies aber nicht aus Gründen der Ausfallsicherheit geschieht. Die Gründe dafür sind vielfältig, aber zusammenfassend lässt sich sagen, dass die Entwicklung von Anwendungen für die Nutzung mehrerer Clouds schwierig ist. Die Verwaltung mehrerer Versionen derselben Anwendung in mehr als einer Cloud kann zu massiven Ineffizienzen, Komplexitäten und redundanten Aufgaben führen. Wie der aktuelle Ausfall von Amazon Web Services (AWS) zeigt, können Single-Cloud-Strategien neue und ungewohnte Fehlerquellen schaffen. 

Ja, die Cloud ist widerstandsfähiger als Ihr Rechenzentrum – aber … 

Ein unglaublich attraktives Verkaufsargument für die Cloud ist die inhärente Ausfallsicherheit von Arbeitslasten und Daten. Mit Verfügbarkeitsmetriken im Bereich von fünf bis neun und einer versprochenen Datenbeständigkeit von 11 bis neun scheint die Migration in die Cloud ein Allheilmittel für technologische Ausfallsicherheit zu sein. Jede Technologieplattform hat jedoch ihre eigenen Risiken. Im Jahr 2021 kam es bei allen großen Cloud-Anbietern zu Ausfällen, die teilweise nur wenige Minuten, teilweise aber auch Stunden dauerten. Und wie AWS-CTO Werner Vogels auf seiner jüngsten re:Invent keynote erklärte, sind viele AWS-Dienste mit anderen zugrundeliegenden Diensten verknüpft – was bedeutet, dass AWS-Benutzer möglicherweise von Diensten abhängig sind, von denen sie nicht einmal wissen, dass sie sie in Anspruch nehmen. 

Viele dieser Ausfälle waren auf menschliche Fehler zurückzuführen, die durch die Automatisierung noch verstärkt wurden, während einige auf Cyberangriffe wie massive verteilte Denial-of-Service-Angriffe auf wichtige Cloud-Infrastrukturen zurückzuführen waren. Um die massiv redundante Infrastruktur aufzubauen, die die Hyperscaler bereitstellen, verfügen sie über ein komplexes Ökosystem aus Automatisierung und miteinander verknüpften Diensten, die im Falle eines Angriffs oder Fehlers systemische Ausfälle auslösen können. 

Multi- und Hybrid-Cloud-Strategien ermöglichen es Ihnen, Single-Cloud-Risiken zu entschärfen 

Ein wesentlicher Bestandteil der Ausfallsicherheitsplanung ist das Verständnis der besonderen Risiken für Ihr Unternehmen. Technologieführer müssen diese Risiken für die wichtigsten Komponenten ihrer Infrastruktur, einschließlich der Cloud-Anbieter, berücksichtigen. Wenn Sie eine wichtige Geschäftsanwendung bei einem bestimmten Cloud-Anbieter hosten, teilen Sie dessen Risikoprofil. Wenn dieser Cloud-Anbieter ausfällt, kann Ihr Unternehmen Umsatzeinbußen, Produktivitätseinbußen bei den Mitarbeitern, betriebliche Ineffizienzen und möglicherweise ein Reputationsrisiko erleiden. 

Während Ihr Unternehmen seine Cloud-Reise fortsetzt, können Sie eine grundlegende Strategie der Diversifizierung, Abschwächung und Nachfrage verfolgen, um Ihre Cloud-Resilienzstrategie aufzubauen. 

Diversifizieren Sie Ihr Risiko, indem Sie Anwendungen und Dienste entwickeln, die bei Ausfall eines Dienstes automatisch zwischen verschiedenen Cloud-Anbietern oder privaten Infrastrukturen verschoben werden können. Sie müssen nicht Ihren gesamten Stack bei einem anderen Anbieter replizieren, um einen Teil des Risikos der Cloud-Anbieterkonzentration zu mindern. So können Sie beispielsweise einen zweiten Cloud-Anbieter für Notfallwiederherstellung als Dienstleistung, Datensicherung und grundlegende Büroanwendungen nutzen, falls es zu einem längeren Ausfall oder einem Ereignis kommt, das die Zuverlässigkeit Ihrer primären Cloud beeinträchtigt. 

In Fällen, in denen Sie Ihr Technologierisiko nicht diversifizieren können, sollten Sie die Auswirkungen des Risikos mindern, indem Sie für die wichtigsten Geschäftsanwendungen, die bei einem einzigen Cloud-Anbieter gehostet werden, aggressive Metriken auf der Grundlage von Erfahrungswerten festlegen. (Wenn ein anderes Unternehmen einen bedeutenden Teil des Wertstroms Ihres Unternehmens hostet, dann ist dieser Anbieter standardmäßig ein Partner bei der Bereitstellung Ihres Geschäfts, und Ihre Beziehung zu ihm sollte die Risiken für Ihr Unternehmen teilen, die durch sein Risikoprofil entstehen. Die Abhilfemaßnahmen sollten mehr sein als nur minutenweise Gutschriften für nicht verfügbare Dienste.) 

Bei erstklassigen Software-as-a-Service (SaaS)-Anwendungen sind die Möglichkeiten begrenzt, aber es liegt in der Verantwortung Ihres Unternehmens, sich nach dem Risikominderungsplan des Anbieters für seine Dienste zu erkundigen. Kundenbedürfnisse und -anforderungen sind ein mächtiges Werkzeug bei der Gestaltung der Angebote von SaaS-Anbietern, vor allem, wenn der Kundenstamm ähnliche Anforderungen an die Ausfallsicherheit stellt. 

 *Besonderer Dank geht an meine Kollegen Lee Sustar und Tracy Woo für ihre Unterstützung bei der Erstellung dieses Beitrags. 

 

NB: Dieser Blog wurde aus dem Englischen übersetzt.