Wartungsarbeiten am Standort First Colo

Veröffentlicht am 10.07.2018

Diese Ankündigung wurde allen betroffenen Kunden zusätzlich per Mail zugesandt.

Hiermit kündigen wir Ihnen umfangreiche Wartungsarbeiten an unserem Rechenzentrumsstandort First Colo an. Diese finden am Abend des 13.07.2018 ab 21:00 Uhr statt und werden voraussichtlich bis 4:00 Uhr morgens abgeschlossen sein. Während der Wartungsarbeiten wird es je Hostsystem zu einer Nichtverfügbarkeit von planmäßig 45-60 Minuten kommen. Dies betrifft gleichermaßen unsere eigene Infrastruktur wie Webseite, Ticketsystem und Kundenbereiche / Verwaltungsoberflächen.

Gegenstand der Wartung ist vorwiegend der Umzug unserer gesamten Serverlandschaft in Raum 2 des Rechenzentrums und damit einhergehend die Inbetriebnahme einer eigenen Routinginfrastruktur, wobei die Umschaltung auf diese am Folgetag stattfindet. Darüber hinaus nutzen wir die Gelegenheit für ohnehin notwendige BIOS-, Kernel- und Softwareupdates, um die Systeme nicht öfter als notwendig neustarten zu müssen. Dies umfasst auch die Einspielung der neuesten verfügbaren Patches gegen die CPU-Sicherheitslücken Meltdown und Spectre.

Die finale Umstellung auf unsere Router kann technisch bedingt erst erfolgen, wenn alle Server physikalisch umgezogen wurden. Am Abend des 14.07.2018 um 23:30 Uhr werden wir daher alle IP-Netze auf unsere neue Infrastruktur umrouten lassen und zeitgleich auf unserer Seite die entsprechenden Konfigurationsänderungen aktivieren. Der Vorgang selbst wird auf unserer sowie auf Seite des Rechenzentrums umfangreich getestet und zeitgleich zum definierten Zeitpunkt unter personeller Aufsicht angestoßen. Wir rechnen daher lediglich mit einer sehr kurzen Verbindungsunterbrechung im Minutenbereich, während der ab dem Zeitpunkt aktive Router unter anderem seinen ARP-Cache (Zuordnung IP -> MAC-Adresse) aufbauen muss. Für den unwahrscheinlichen Fall von Komplikationen bei der Umstellung sind zu diesem Zeitpunkt sicherheitshalber Mitarbeiter von uns im Rechenzentrum anwesend.

Anpassungen an Ihrer Netzwerkkonfiguration sind nicht erforderlich, ebenso erfolgt im Rahmen dieser Umstellung kein weiterer Neustart der Systeme.

Durch die Migration auf unsere neue Netzwerkinfrastruktur ergeben sich eine Vielzahl von Vorteilen. So verfügen wir künftig über eine größere und räumlich direktere Anbindung an das Rechenzentrum. Unsere Routing- und Switchingkomponenten werden sowohl extern als auch intern mehrfach redundant konnektiert, sodass beispielsweise der Ausfall eines Uplinks von uns zum Rechenzentrum keine Störung verursachen würde.

Zusätzlich zu der stark vergrößerten Gesamtkapazität unseres Netzwerks und den geringeren internen Latenzen haben wir mit dem Betrieb eigener Router künftig die Möglichkeit, den Traffic unserer Kunden noch besser als bisher zu separieren und die Sicherheitsmaßnahmen innerhalb unseres Netzwerks auch in Zukunft fortwährend zu erweitern. Wir legen hiermit den Grundstein für eine Infrastruktur, die sich wesentlich besser skalieren lässt, um den stets wachsenden Anforderungen an Bandbreite, Verfügbarkeit und Funktionalität gerecht zu werden.

Neben den netzwerkseitigen Vorteilen ist der zukünftig von uns bezogene Raum in vielerlei Hinsicht moderner ausgestattet, so verfügt dieser über ein noch besseres Branderkennungs- und Löschsystem sowie eine zukunftsweisende Kabelführung. Die Stromversorgung unserer Server und Netzwerkgeräte erfolgt weiterhin redundant über zwei getrennte Stromkreise, die zusätzlich über eine USV und einen Dieselgenerator abgesichert werden.

Während und nach der Wartung werden wir Sie über unsere Social-Media-Präsenzen Facebook und Twitter auf dem Laufenden halten und interessierten Kunden auch einen bildlichen Einblick geben. Aufgrund des Umfangs der Arbeiten haben wir auch auf unserer Webseite eine News veröffentlicht, die wir bei Bedarf aktualisieren werden.

Sobald alle Arbeiten abgeschlossen wurden, werden wir die Redundanzen noch einmal im Produktivbetrieb testen, indem wir beispielsweise verschiedene Server- und Rack-Uplinks dekonnektieren und auch einen vollständigen Routerausfall simulieren und somit den Failovervorgang auf das Standby-Gerät herbeiführen und testen werden. Wir rechnen hierbei aufgrund vorheriger Tests mit keinen relevanten Beeinträchtigungen des Betriebs.

Wir bedanken uns für Ihr Verständnis und bitten um umgehende Kontaktaufnahme per Support-Ticket (hi@php-friends.de oder Kontaktformular auf der Webseite / im Kundenbereich), sollte Ihr Produkt länger als eine Stunde nicht verfügbar sein oder anschließend anderweitige Konnektivitätsprobleme aufweisen. Falls Sie Fragen zu den Wartungsarbeiten haben, stehen wir Ihnen gerne zur Verfügung.

Update, 14.07.2018 9:15 Uhr: Wir blicken auf einen erfolgreichen ersten Teil unserer Wartungsarbeiten zurück. Zwar konnten wir noch nicht sämtliche Server umziehen, jedoch einen absoluten Großteil, und bei allen Kundenservern blieb es - mitunter deutlich - unter der angekündigten Downtime von einer Stunde. Mit einigen Systemen unserer eigenen Infrastruktur waren wir länger beschäftigt, weshalb sich die Arbeiten doch etwas verzögert haben. Mit den übrigen Systemen werden wir heute Abend weitermachen - weitere Infos und Fotos folgen. Die letzten Stunden waren wir mit Dokumentation und Aufräumarbeiten beschäftigt, der letzte Umzug erfolgte gegen 6:20 Uhr.

Update, 15.07.2018 2:30 Uhr: Wie einige Kunden bemerkt haben werden, war vnode20 noch ein zweites Mal für ca. 40 Minuten offline. Hier gab es leider kurz nach dem Booten der VMs ein Problem mit dem RAID, welches sich auf gelockerte Kabel zurückführen ließ. Die Diagnose sowie die Behebung des Kernproblems ging schnell, wir brauchten allerdings etwas Zeit, um das RAID auf sicherem Wege wieder in einen konsistenten Zustand zu überführen, um die Daten auf keinen Fall zu gefährden.

Newsletter abonnieren

Bleiben Sie aktuell und erhalten Sie besondere Angebote als Erster, indem Sie unseren Newsletter abonnieren.

Um diesen Newsletter zu beziehen, müssen Sie mindestens 16 Jahre alt sein.

Monitored by Bloonix