当云服务器后端使用的是rbd方式对接云平台时,有时会遇到宿主机意外断电,停机或重启故障后,VM会报超级块(superblock)的问题导致VM的系统无法正常启动的处理办法:
原因:由于主机突然断电导致RBD锁住,VM无法启动,需要解锁。Ceph RBD的锁机制。当使用exclusive-lock特性时,RBD镜像会被客户端锁定,防止多个客户端同时写入导致数据损坏。突然断电可能导致锁未被正确释放,所以VM无法启动,因为锁仍然存在。
解决方法:
#查看镜像的锁信息(需指定池和镜像名称)
rbd lock ls <pool>/<image>
# 强制删除锁(需指定锁的ID)
rbd lock remove <pool>/<image> <lock-id> <client-id>
#实例:
rbd lock ls hdd_pool_01/abad99f9-50dd-4c8d-b595-0ff7f50cfa4d988
rbd lock remove hdd_pool_01/abad99f9-50dd-4c8d-b595-0ff7f50cfa4d "auto 94778552067968" client.1264649449