SAS 系統管理 (51)

教學目標

初步了解 LSF 工具如何安裝、啟動、停止和故障排除等基本操作。

重點概念

首先在 SAS 解決方案中,我們通常會透過 SAS 平台套件提供企業排程的功能,此套件我們簡稱為 LSF,其全名為 Platform Load Sharing Facility,其主要是分配目前異質 IT 資源之間分配的工作,以利建立可分享、可擴展和可容錯的基礎架構,更進一步提供更快速、更可靠的工作負載平衡的分配資源,同時提供資源存取和降低維運成本。

接著若我們要開始透過 SAS 安裝檔中的 LSF 套件進行安裝,則主要有下述五個步驟,分別為:

  1. 建立 lsfadmin 帳號
  2. 解壓縮 LSF 安裝壓縮檔
  3. 確認 license.dat 金鑰檔
  4. 修改install.config 設定檔
  5. 執行 jsinstall 安裝檔

建立 lsfadmin 帳號

1
2
$ useradd -g sas lsfadmin
$ passwd lsfadmin

解壓縮 LSF 安裝壓縮檔

1
2
$ su lsfadmin
$ tar -xvf <LSF 安裝壓縮檔路徑>

產生 license.dat 金鑰檔

1
$ cp <LSF 金鑰檔> <LSF 安裝壓縮檔路徑/license.dat>

修改install.config 設定檔

1
2
3
4
5
6
7
8
9
10
11
$ cd  <LSF 安裝壓縮檔路徑>
$ cp install.config install.config.bak
$ vi install.config
JS_TOP=/usr/local/pm
JS_HOST=host1
JS_ADMINS=lsfadmin
JS_LICENSE=/home/lsfadmin/pm9.1.3.0_sas_pinstall/license.dat
LSF_INSTALL=true
LSF_TOP="/usr/share/lsf"
LSF_CLUSTER_NAME="cluster1"
LSF_MASTER_LIST="host1"

執行 jsinstall 安裝檔

1
2
$ cd  <LSF 安裝壓縮檔路徑>
$ ./jsinstall -f install.config

再來當我們安裝完成之後就能夠透過下述指令啟動 LSF 工具和停止 LSF 工具。

啟動 LSF 工具

1
2
3
4
5
6
7
$ . /usr/share/lsf/conf/profile.lsf
$ lsadmin limstartup
$ lsadmin resstartup
$ badmin hstartup
$ badmin ckconfig -v
$ . /usr/local/pm/conf/profile.js
$ jadmin start

停止 LSF 工具

1
2
3
4
5
6
$ . /usr/local/pm/conf/profile.js
$ jadmin stop
$ . /usr/share/lsf/conf/profile.lsf
$ badmin hshutdown -f
$ lsadmin resshutdown -f
$ lsadmin limshutdown -f

最後當我們發現無法透過 SAS Management Console 工具中的排程功能正常連線至 LSF 工具時,需要進行故障排除,則可以透過下述指令進行檢查。

檢查 LSF 狀態

1
2
3
$ lsadmin chconfig -v
$ badmin chconfig -v
$ telnet <LSF 工具 IP 位置> 1966

其中若是 telnet 工具嘗試連線被拒絕,則先停止 LSF 工具,接著啟動 LSF 工具,重新透過 telnet 工具嘗試連線即可。此外當我們能夠正常連線之後,則可以透過 SAS Management Console 工具中的排程功能新增排程立即執行或排程執行,並且查看 LSF 相關的 Log 檔是否正常執行。

總結 LSF 工具主要是提供了一個資源管理框架,主要可以滿足我們工作的需求,找到最佳的資源執行工作,並且監控工作進度。此外若是有些 LSF 工作排程無法正常刪除時,則請透過 IBM Platform Process Manager 工具進行處理,因為 SAS Managemnet Console 在某些特殊情況下無法取得正確的工作排程資訊。

相關資源