在使用Lustre过程中遇到的问题

楼下的Lustre集群总是遇到重启之后无法启动起来的情况,经常需要下楼手动重启机器,很痛苦,最近终于找到了原因。

无法重启原因

为了使用lustre,需要挂载一个内核模块,即

 sudo modprobe -v lustre

经过验证,正是这个模块导致了无法重启,我们要做的就是在关机之前从内核中移除这个模块,即

sudo lustre_rmmod 

之前想法是把reboot命令alias成我自己写的safe-reboot脚本,在里面先进行移除操作,但是这个做法有缺陷,跟师兄讨论了一哈,目前想法是添加到关机服务中去,正在尝试

只要在

/usr/lib/systemd/system-shutdown/

下添加一个脚本即可

  • user/duo/bug-about-lustre.txt
  • 最后更改: 6年前
  • 王一多