前段时间在连接 vSphere Web Client 时,注意到有一个警告信息,其中包含“Ldap backup task monitor”、“vCenter Database”的警告,与厂商联系后,尝试重启 vCenter,没想到就再也无法通过 vSphere Web Client 或 VMware vSphere Client 连接到 vCenter 了。

查看 vCenter 的開機過程可以注意到有幾個服務啟動失敗,其中包含 database 及 vpxd 的 initialize,vpxd 的 initialize 更是要等個十分鐘才出現 failed。

開完機後,除了 vSphere Web Client 及 VMware vSphere Client 無法連線,VMware vCenter Server Appliance (https://ip:5480) 會出現無法登入(驗證失敗)的情形。另外若透過 SSH 連線,會要你更改密碼,但輸入完新密碼又出現無法寫入的訊息。

之後在廠商的指導下,確認是磁區被 log 塞爆,造成資料庫無法啟動,下方為解決過程。
◎從 Console 使用 root 登入,如果登入失敗,参考 This 重設 root 密碼,重點如下:
#在 VMware vCenter Server Appliance 按下 e,進入編輯模式。 #選擇第二項「kernel /vmlinuz-......」再按下 e,進入編輯模式。 #在「...usb audit=1」後面加上" init=/bin/bash",按下Enter。 #選擇第二項「kernel /vmlinuz-......」再按下 b,以此項目開機。 #輸入 passwd 以修改 root 密碼,完成後輸入 reboot 重開。
◎輸入 df -h,檢查各磁區的使用情形。以我來說 “/” 滿了。

◎輸入下列指令,檢查 audit 佔用情形。我的正常,如果过量,可参考 This 处理。
cd /var/log/audit ls -lh

◎輸入下列指令,检查 log 占用情况。可以看到 ./ldapmessage-20191205 占用5.8G。
cd /var/log du -xah | sort -h | tail -n 50

◎参考 This 删除文件,并注释 /etc/hosts 的 IP6 设置,避免再次发生。
rm ./ldapmessage-20191205 vi /etc/hosts ----------------------- 127.0.0.1 <FQDN> <Hostname> #::1 <hostname> localhost ip6-localhost ip6-loopback -----------------------

◎完成后,重启即可恢复 vCenter 运行。
【参考链接】







