Unsere Backup / Disaster Recovery Policies
Unsere Backup / Disaster Recovery Policies
Dies ist ein Blogbeitrag adressiert an technisch interessierte Anspruchs- oder Interessengruppen von IntraHub. Die Idee ist es Ihnen aufzuzeigen wie eine IntraHub Instanz aufgebaut ist, wie und wie häufig diese gesichert wird und wie diese in einem worst-case Szenario wiederhergestellt werden kann und natürlich die Folgen für Sie als Benutzer in einem solchen Fall. Schlussendlich läuft auch die Cloud von IntraHub „nur“ auf baremetal Servern auf welchen theoretisch immer etwas passieren kann. 2021 kam es bei Google Clouddiensten zu einem Teilausfall und bei Meta (ehemalig Facebook) zu einem Totalausfall.
IntraHub hat Massnahmen gegen potentielle Downtime sowie Datenverluste auf den folgenden vier Ebenen getroffen:
- Ebene Rechenzentrum
- Ebene Server
- Ebene Betriebssystem
- Ebene Dateien
Ebene Rechenzentrum
Alle IntraHub Instanzen werden in einem 2018 gebauten Rechenzentrum in Nottwil gehosted. Das Rechenzentrum verfügt über eine redunande und unterbruchsfreie Stromversorgung (USV) und im Ernstfall über Dieselnotstromaggregate. Eine digitale Einlasskontrolle sowie Videoüberwachung und permanent verschlossene Racks gehören zu den Sicherungsstandards. Zudem ist das Rechenzentrum erdbebensicher, wird mit 100% Naturstrom betrieben und ist ISO27001, FINMA sowie mit der RC4 Einbruchnorm zertifiziert.
Schemantische Darstellung
Ebene Server
Ein Server besteht aus verschiedenen Komponenten. Best practice hierbei ist es fehlerkorrigierenden Arbeitsspeicher zu verwenden, ein redundantes System aus Festplatten sowie redundante Netzteile zu verwenden. Dies ist der Standard von jedem Server bei IntraHub und wird in der Zeichnung weiter unten als teilredundanter Server bezeichnet.
Um eine komplette Redundanz aller Komponenten zu erreichen könnte ein sogenanntes high availability Cluster erstellt werden in welchem der selbe Server gespiegel in verschiedenen Rechenzentren läuft. Ob ein high availability Cluster für ein Unternehmen sinnvoll ist, kann gerne mit uns in einem Gespräch besprochen werden. Meistens jedoch nicht.
Ebene Betriebssystem
Jede IntraHub Instanz wird auf einem private Cloud Server bereitgestellt. Einmal pro Woche wird ein sogenannter Snapshot der ganzen Cloud Instanz erstellt. Ein Snapshot ist der Zustand eines Systems zu einem bestimmten Zeitpunkt. Dieser geschieht ohne dass das System heruntergefahren werden muss. Dieser Snapshot wird innerhalb vom Rechenzentrum aufbewahrt jedoch auf einem separaten Server. Der Snapshot ist ein Notfall Backup, sollte sich das Backup auf Datei Ebene nicht wiederherstellen lassen.
Ebene Daten
Auf der Ebene der Dateien wird 2 mal täglich ein inkrementelles Backup aller Daten erstellt sowie ein vollständiger Dump aller Datenbanken. Dabei werden die letzten 60 inkrementellen Backups behalten. D.h. jede IntraHub Instanz kann theoretisch in den Zustand von einem der letzten 30 Tage gesetzt werden. Diese Datensicherung wird von uns auch verwendet, wenn wir eine IntraHub Instanz auf einen neuen Release updaten.
Überprüfung der Integrität der Backups
Wann immer wir einen neuen Release auf die IntraHub Clouds aufspielen nehmen wir eine leere Cloud Instanz und updaten via das Backup auf die neuste Version. Dies erlaubt es uns jeweils einen Backup Recovery Prozess durchzuspielen und validiert die Integrität des bestehenden Backups. Falls in einem solchen Update Prozess fehlerhafte Backups gefunden werden würden, könnten diese anhand der noch vorhandenen Instanz korrigiert werden. Als Anhang: Backups werden nicht einfach korrupt. Jedoch ist es für einen Systemadministrator beruhigend von Zeit zu Zeit zu sehen, dass ein Disaster Recovery funktionieren würde wie erwartet.
Ein solcher Update Prozess ist uns möglich, da IntraHub alle User Daten separat von den ausführenden Programmen und Dienste speichert. D.h. die Programme welche auf den IntraHub Cloud Instanzen laufen sind exakt identisch, lediglich die User Daten unterscheiden sich.