====== 在使用Lustre过程中遇到的问题 ====== 楼下的Lustre集群总是遇到重启之后无法启动起来的情况,经常需要下楼手动重启机器,很痛苦,最近终于找到了原因。 ==== 无法重启原因 ==== 为了使用lustre,需要挂载一个内核模块,即 sudo modprobe -v lustre 经过验证,正是这个模块导致了无法重启,我们要做的就是在关机之前从内核中移除这个模块,即 sudo lustre_rmmod 之前想法是把reboot命令alias成我自己写的safe-reboot脚本,在里面先进行移除操作,但是这个做法有缺陷,跟师兄讨论了一哈,目前想法是添加到关机服务中去,正在尝试 只要在/usr/lib/systemd/system-shutdown/下添加一个脚本即可