目前遇過以下幾種:
- gensis image缺少網卡驅動
- BMC FRU/DMI的值為空(Manufacturer, Serial Number, Part Number)
- ipmitool搭配lanplus選項造成連線失敗
gensis image缺少網卡驅動
處理方式: 重新build一個包含相對應網卡驅動的gensis image
以下指令的測試環境為Redhat 9.3
1 | cd /tmp |
BMC FRU/DMI的值為空
處理方式: 使用各家廠商自己的工具調整BMC FRU的值(Manufacturer, Serial Number, Part Number),有時候連DMI都要一起調整
以下為追查DMI的議題的脈絡:
利用IPMI Tool確認ipmitool fru print
,結果有值,發現只改FRU無效
在/var/log/xcat/cluster.log
發現以下log
log
1 | Warning: Could not find any node for $mtms using mtms-based discovery |
查到該log是從/opt/xcat/lib/perl/xCAT_plugin/typemtms.pm而來,找到相關變數$mtms並確認serial為空
1 | my $mtms = $request->{'mtm'}->[0] . "*" . $request->{'serial'}->[0]; |
知道MTMS discovery是透過gensis image完成該行為,檢查dodiscovery中serial是如何取得,檢查已載入gensis image的目標節點,利用BMC Console確認/sys/devices/virtual/dmi/id/product_serial
的值確實為空
1 | SERIAL=`cat /sys/devices/virtual/dmi/id/product_serial` |