Am Montag, den 10. Oktober 2016, um 20:24 Uhr, trat ein kaskadierender, doppelter Hardwarefehler an unserem Serversystem (Enterprise Storage Array) im Rechenzentrum in Oslo auf. Dieser führte dazu, dass unser vollredundant konzipiertes System zeitweilig nicht erreichbar war. Die Untersuchungen zu den genauen Ursachen des Vorfalls dauern noch an. 

Unser Operationsteam identifizierte das Problem eine Stunde vor dem Systemausfall, verständigte sofort die Spezialisten des Herstellers des Serversystems und begann zugleich mit der Fehlerbehebung. 

Für Kunden, deren Daten in unserem Rechenzentrum in Oslo verarbeitet werden, hatte der Vorfall einen Systemausfall in der Zeit von Montag, den 10.10.2016, von 20:26 Uhr bis Dienstag, den 11.10.2016, 09:30 Uhr – gesamt 13 Stunden und 4 Minuten – zur Folge. Hernach, während der Zeit von 09:30 Uhr bis 13:30 Uhr am Dienstag, den 11.10.2016, waren diese Kunden von kleineren Störungen des Sofortnachrichten-Systems, der Benachrichtigungen und ggf. der Verfügbarkeit von Microsoft-Online-Dokumenten betroffen. 

Während der im Anschluss an den Systemausfall notwendig gewordenen Reparaturarbeiten war itslearning auch in der Zeit von 03:30 Uhr bis 07:30 Uhr am Mittwoch, den 13.10.2016, nicht erreichbar.

Für itslearning ist jegliche ungeplante Nicht-Erreichbarkeit nicht akzeptabel. Um ähnliche Vorfälle für die Zukunft auszuschließen, werden wir: 
  • Unsere gesamte Hardware-Infrastruktur vollständig überprüfen und identifizierte Schwachstellen umgehend beseitigen
  • Noch enger mit unseren Service- und Hardwarepartnern zusammenarbeiten, um die im Service-Level-Agreement (SLA) vereinbarte Verfügbarkeit stabil zu gewährleisten
  • Unsere internen Unternehmensprozesse überprüfen, um sicherzustellen, dass mögliche zukünftige technische Störungen geringstmögliche Auswirkungen haben werden


Update (16:49 Uhr): Alle Systeme arbeiten wieder normal.  

Update (09:27 Uhr): Alle itslearning-Sites sind wieder erreichbar. Das System läuft zunehmend stabiler. Falls Sie noch Probleme beim Anmelden haben, versuchen Sie es bitte ein paar Minuten später erneut.  

Update (08:25 Uhr): Unsere europäischen Kunden können ihre itslearning-Sites leider noch immer nicht aufrufen. In spätestens 30 Minuten werden wir Sie erneut informieren. 

Update (07:12 Uhr): Leider konnte die Kernursache der Störung noch nicht identifiziert werden. Die Arbeiten dauern noch an. 

Update (04:25 Uhr): Die Untersuchungen der Störung werden gemeinsam mit technischen Experten einer Drittpartei fortgeführt.

Update (02:25 Uhr): Unser Ingenieursteam untersucht weiterhin die Ursache des Ausfalls. Das ist unsere höchste Priorität bis der Service wieder verfügbar ist. Der letzte Versuch, das System neu zu starten, war aufgrund anhaltender Hardwarefehler leider nicht erfolgreich. Wir bedanken uns für Ihre Geduld. 

Update (00:13 Uhr): Das System lief leider nicht stabil und ist derzeit erneut nicht erreichbar. Unser Team untersucht diesen neuen Ausfall.  

Update (23:55 Uhr): Der Fehler wurde behoben und das System wieder hochgefahren. Ihre Sites sind wieder erreichbar. Es können derzeit noch teilweise längere Ladezeiten auftreten. Unsere Ingenieure arbeiten weiterhin an der Stabilisierung und besseren Performance des Systems. Wir bitten Sie für die entstandenen Unannehmlichkeiten um Entschuldigung.

Update (23:21 Uhr): Die Kollegen in Norwegen haben die Ursache identifiziert: ein Hardwarefehler im Serverpool des Hosting Centers. Derzeit läuft die Reparatur. Ihre itslearning-Sites sollten Ihnen in Kürze wieder zur Verfügung stehen.

Update (22:31 Uhr): Das Problem besteht noch. Die itslearning-Kollegen in Bergen und das Team des Hosting Centers in Oslo arbeiten mit Hochdruck an der Beseitigung der Störung. 

21:08 Uhr: Wir haben aktuell einen temporären Serverausfall. Unsere Ingenieursteam analysiert den Vorfall und bemüht sich, die Störung rasch zu beheben.