Server GAU -oder- Datenträgerfehler auf der Virtualisierungsplattform
Ein Backupkonzept für seine virtuellen Maschinen zu haben ist gut. Ein Backupkonzept für den Datenträger mit der Virtualisierungsplattform zu haben wäre noch besser gewesen. So kam es dann wie es kommen musste: Eines schönen Tages verabschiedete sich der Datenträger auf dem die Virtualisierungsplattform lief.
Mit einer gesunden Portion Optimismus wurde der Server so schonend wie möglich ausgeschaltet um evtl. doch noch Daten aus dem Datenträger sichern zu können. Leider hat Flashspeicher die Angewohnheit entweder ganz oder gar nicht zu funktionieren und so stellte sich heraus, dass der Datenträger das zeitliche gesegnet hatte.
Also wurde zunächst ein neuer Datenträger beschafft. Hierbei wurde direkt ein Upgrade der Speicherkapazität des neuen Datenträgers berücksichtigt. Anschließend musste Proxmox neu aufgesetzt werden (natürlich direkt 8.x). Der große Vorteil in meiner misslichen Lage war, dass die Maschinen auf einem anderen Storage lagen, als das Hostsystem. Das sollte eigentlich selbstverständlich sein – ist es aber gerade im Heim- oder Kleinanwenderbereich nicht. Dieser separate Storage war noch vollkommen intakt. Die Daten der virtuellen Maschinen waren also noch da. Lediglich die Konfigurationen waren mit dem Hostsystem ins Nirwana aufgebrochen.
Auf dem frisch aufgesetzten System mussten im Datacenterbereich also die vorhanden Storages hinzugefügt werden. Anschließend mussten die VMs neu erstellt werden (da Proxmox keine Möglichkeit bietet einer neuen Maschine eine bestehende Disk zuzuweisen). Hierbei empfiehlt sich die Vergabe der gleichen IDs wie auf dem vorigen System. Bei der Anlage der Maschinen ist dann darauf zu achten, dass nur eine Dummy Disk mit äußerst wenig Speicher verwendet wird (1GB), da der Speicher sonst ggf. doppelt allokiert wird. Anschließend mussten die VM Konfigurationen unter „/etc/pve/qemu-server/[vmid].conf“ dahingehend angepasst werden, dass die Disk nicht mehr auf die Dummy Disk sondern die vorhandenen Disks auf dem intakten Storage zeigen (Stichwort „scsi0“).
Abschließend empfiehlt sich ein „qm rescan –vmid xxx“ durchzuführen, damit die angelegten Dummy Disks als „unused“ erkannt werden und entsprechend entfernt werden können. Damit wird dann auch der Platz auf dem Storage wieder freigegeben.