SAS Intelligence Platform

SAS 系統管理 (31)

教學目標

初步了解針對不同 SAS 解決方案部署規劃檔的內容。

重點概念

一般來說,當我們部署 SAS 解決方案之前必須先確認 plan.xml 部署規劃檔內容是否配置正確的部署計劃。部署計劃主要是基於 XML 格式進行 SAS 系統的描述類似於架構師的規劃,主要描述最終 SAS 軟體部署的環境,當這規劃被使用於 SAS 軟體部署流程時會告訴 SAS 部署精靈哪一個軟體元件在每一台機器上需要安裝和設定的項目。

基本上,我們可以透過官方網站 下載標準部署計劃的壓縮檔 ZQJ_plan.zip,像是 SAS Enterprise Miner、SAS Enterprise Guide、SAS Visual Analytics、… 等。接著當我們解壓縮 ZQJ_plan.zip 壓縮檔時,除了開啟 index.html 了解注意事項之外,更要了解下述檔案中內容。

Pre-Installation Checklist

主要有 checklist.pdf 和 checklist.rtf 兩種不同檔案格式的文件,其內容皆是根據不同的節點類型會有不同的安裝前檢查表,像是資料來源、網路設定、安全設定、群組設定、帳號設定、連接埠、本機設定、第三方軟體、… 等檢查表清單。在文件中也會根據硬體架構提供配置的最佳實務和準則,像是的 SAS Visual Analytics 就是建議記憶體每個節點中依據每核 CPU 至少 8GB 大小符合準則,SAS WORK 至少需要每秒 100 MB 的存取速度為最佳實務。此外當我們要在同一台機器部署多套 SAS 解決方案時,最大問題點在於 SAS 中不同伺服器的連接埠,此時在此文件中就會針對 Lev1 至 Lev9 有建議預設的連接埠,非常實用。當然文件也明確告知請關閉防毒軟體和防火牆軟體預防安裝時發生錯誤。

Deployment Steps

主要為 deployment_steps_text.html 檔案文件,其中主要是描述部署的步驟,通常會建議先安裝 Server Tier,接著安裝與設定 Middle Tier ,再來安裝與設定 Metadata Server Node,以及安裝與設定 Middle Tier Node ,最後安裝與設定 Client。然而通常我們進行安裝與設定時會建議分開進行,像是先同步安裝 Server Tier 、 Middle Tier 、 Metadata Server Node 和 Middle Tier Node ,接著先設定 Server Tier ,再來設定 Middle Tier,以及根據需求同步設定 Metadata Server Node 和 Middle Tier Node,最後安裝與設定 Client。

Detail / Summary Diagram

主要為 details_diagram.html 和 details_diagram_for_ie7.mht 兩種不同檔案格式的文件,其內容皆是繪製詳細架構圖表於網頁中呈現,圖表內容主要包括有幾種類型的節點,以及節點中所需安裝的軟體。至於 summary_diagram.html 和 summary_diagram_for_ie7.mht 則皆是繪製摘要架構圖表於網頁中呈現。

總結當我們充份了解上述三種類型的檔案內容之後,才能夠將在 SAS 部署精靈中透過 plan.xml 部署規劃檔進行自動化的部署,請注意若是 plan.xml 部署規劃檔設定錯誤嚴重時將會需要重新安裝,此外 SAS 顧問則會針對不同企業的訂單和架構需求,透過訂單中特定編號資訊製作符合的 plan.xml 部署規劃檔。

相關資源

SAS 系統管理 (29)

教學目標

初步了解 SAS 環境管理員的基本概念。

重點概念

SAS 環境管理員主要 SAS 環境的管理解決方案,主要是以網站為基礎,主要可以讓我們執行四項任務,分別為:

  1. 管理、監控和管理 SAS 資源,主要管理 SAS 網頁應用程式和監控 SAS 基礎伺服器。
  2. 監控事件記錄和報表警告訊息,當 SAS 資源的特定指標超過門檻值就會產生警告訊息。
  3. 收集 SAS 資源等監控資訊,並且建立視覺化圖表,主要建立資料健康狀態和營運的全方位觀點。
  4. 透過資料市集、指標資訊和報告中心所提供的報告,將 IT 和 SAS 資源的監控納入服務管理策略中。

SAS 環境管理員主要是執行在 SAS 網頁伺服器之後,任何 Reverse Proxy 伺服器皆不支援,而 SAS 環境管理員主要是由執行在平台中的代理器所組成,所有的代理器主要會與集中管理伺服器進行溝通,其中代理器會持續監控和偵測資源,並且持續產生資料指通報告傳回伺服器中。

SAS 環境管理員主要包括五個主要元件,分別為:

  1. 代理器
  2. 管理伺服器
  3. 資料庫
  4. 應用程式
  5. 外掛

所謂代理器主要是執行在 SAS 伺服器和 SAS 中間層伺服器中,其主要責任為探索平台中的軟體元件和執行資源控制的行為。接著管理伺服器主要責任則是與代理器溝通,主要會收集許多與 SAS 資源相關的資訊,像是探索資料、指標、可用性、…等資訊。再來收集的資料會被儲存至資料庫中,主要是使用 PostgreSQL 資料庫和 SAS Web Infrastructure Platform 資料伺服器,當資源被發現和加入清單中時,資料庫將會儲存來自於傳理器與資源相關的資料。最後應用程式主要是網頁為基礎的界面系統,主要進行圖表呈現、事件警示和控制管理等應用,此外透過外掛將能夠收集更多有關不同廠商資源的相關資訊。

總結 SAS 環境管理員主要是提供報告,以利協助進行故障排除和效能調效,雖然有提供稽核、存取和連接資料的報告,但是並無法保證其完整性,若有需要請詢問 SAS 顧問。

相關資源

SAS 系統管理 (28)

教學目標

初步了解如何解決預存程式伺服器執行預存程式所發生的錯誤問題之方式。

重點概念

一般來說,我們會透過 SAS 部署精靈安裝和設定 SAS 解決方案,然而當順利完成 SAS 部署精靈之後,通常會需要進行 SAS 解決方案的後續設定,常常就會需要透過 SAS 預存程式伺服器執行預存程式,但有時會發生錯誤,此時我們要如何查看錯誤訊息呢?

基本上,當 SAS 預存程式伺服器執行預存程式發生錯誤時會顯示「完成請求,但有錯誤。」的訊息,此時我們只要按下顯示 SAS 日誌就能夠查看錯誤訊息。但有時 SAS 日誌會空白使得我們無法查看錯誤訊息,更進一步解決問題,這時我們就要登入 SAS 伺服器的「C:\SAS\Config\Lev1\SASApp\StoredProcessServer\Logs」資料夾中會有許多「SASApp_STPServer_yyyy-mm-dd_server_xxxxx.log」記錄檔,我們只要找最新的記錄就能夠從中查看錯誤訊息。至於「C:\SAS\Config\Lev1\SASApp\StoredProcessServer\logconfig.xml 」則是設定記錄檔的相關資訊,當設定完成之後請重新啟動「Object Spawner」服務。

接著我們從記錄檔案中搜尋「STPXUTL Execute using file path」關鍵查詢預存程式的 SAS 檔案。接著我們可以透過 SAS 9.4 (Chinese (Traditional)) 開啟 SAS 預存程式檔案執行,就能夠更進一步在「日誌」中查看錯誤訊息,再透過錯誤訊息查看 SAS Code 找出根本原因。例如:當我們發現 Microsoft SQL Server ODBC Driver 11 的 CLI 錯誤問題時,就先透過「ODBC 資料來源管理員 (64 位元)」重新設定驅動程式為「SQL Server」,而非「ODBC Driver 11 for SQL Server」之後,重新啟動「Object Spawner」服務。就能夠解決 Microsoft SQL Server ODBC Driver 11 的 CLI 錯誤問題。

總結我們進行 SAS 解決方案的後續設定,常常就會需要透過 SAS 預存程式伺服器執行預存程式,當有錯誤發生時就能透過查看錯誤訊息的方式一步一步解決問題。

相關資源

SAS 系統管理 (27)

教學目標

初步了解如何透過設定 SAS 選項優化系統效能。

重點概念

當我們在使用 SAS 軟體時要如何透過設定進行優化呢?首先我們可以先開啟「SAS 9.4」輸入下述 SAS 程式查詢可以調整的選項。

1
2
PROC OPTIONS;
RUN;

其中有幾個選項建議進行調整,以利優化 SAS 系統的整體運作效能。

選項 說明 建議值
MEMSIZE 設定可以在 SAS 工作階段期間使用的虛擬記憶體數量的限制。 2G
SORTSIZE 設定可以用於 SORT 程序的記憶體數量。 1G
CPUCOUNT 設定啟用執行緒之應用程式應該採用的處理器數量可以用於平行處理。 4
BUFSIZE 設定輸出 SAS 資料集的緩衝區頁面大小。 64K
UBUFSIZE 設定公用程式檔案緩衝區的大小。 64K
IBUFSIZE 設定索引檔案的緩衝區頁面大小。 32767
BUFNO 設定用於處理 SAS 資料集的緩衝區數量。 10
UBUFNO 設定公用程式檔案緩衝區的數量。 10
IBUFNO 設定索引檔案的緩衝區頁面數量。 10
ALIGNSASIOFILES 在頁面邊界上對齊 SAS 檔案,以改善效能。

總結當我們在維運 SAS 系統時,時間久了經常會需要透過參數的調整優化 SAS 系統整體的效能,此時我們就能夠在 SAS 設定資料夾 (D:\SAS\Config\Lev1\SASApp) 中的 sasv9_usermods.cfg 檔案加入上述選項進行效能優化。

相關資源

SAS 系統管理 (26)

教學目標

初步了解 SAS 商業智慧與分析平台安全連線的重點概念。

重點概念

當我們想要在不安全的網路中保護傳輸的資料時,主要會使用 SSL 安全通訊協定應用至 HTTP 通訊協定上,也就是 HTTPS 安全通訊協定。SAS 9.4 部署流程包括元件的 SSL 設定選項,但是重點在於了解 SSL 安全通訊協定是以公開金鑰加密 (Public Key Cryptography,PKC) 為基礎的技術再透過 X.509 憑證進行實作。在現今電子商務網站皆採用 HTTPS 安全通訊協定,其中 SSL 安全通訊協定運作流程主要有兩個階段,第一個階段是以公開金鑰加密為基礎在客戶端與伺服器進行 Handshake 溝通,其中主要是透過傳統的對稱加密演算法進行安全溝通,其中會交換 Session 特定資料產生加密 Session 金鑰,並且因為 Session 金鑰是在每個 Session 動態產生,待 Session 終止時自動摧毀,所以客戶端和伺服器將會互相同意使用相同的加密演算法。第二階段則是針對每個 Session 使用對稱加密演算法動態產生 Session 金鑰。然而公開金鑰加密主要則是被使用在第一階段,主要透過公開金鑰和私密金鑰進行非對稱加密,通常公開金鑰加密的內容只能夠對應的私密金鑰進行解密,其中交付公開金鑰的機制為 X.509 憑證。

所謂 X.509 是非常廣泛被使用於 SSL 憑證標準,主要應用在於識別公開金鑰的擁有者,其中主要有三種類型的 SSL 憑證,分別為:

  1. 伺服器憑證
  2. 客戶端憑證
  3. CA 憑證

一般來說,伺服器憑證和客戶端憑證會被 CA 進行簽署,所謂簽署是指針對憑證中的資料透過 CA 的私密金鑰進行加密產生單向雜湊碼,之後會透過 CA 憑證中的公開金鑰進行解密和驗證。其中 X.509 憑證中 Subject 欄位主要是被使用於識別擁有者,Issuer 欄位主要是指簽署憑證的 CA 名稱,Subject Public Key Info 欄位主要是包括被使用的公開金鑰演算法和公開金鑰,Signature 欄位主要是訊息簽章,也就是憑證雜湊碼。

對於許多安全敏感的網頁應用程式,像是銀行和電子商務應用程式,單向 SSL 被廣泛使用,當伺服器傳送憑證給客戶端,接著客戶端透過非對稱加密機制驗證伺服器憑證,並且同意使用對稱加密機制建立 Session 金鑰,此時安全通道就會被建立。然而當進行 Handshake 時,伺服器端會要求客戶端憑證,當客戶端傳送憑證給伺服器,接著伺服器透過非對稱加密機制驗證伺服器憑證,再來會透過客戶端憑證中的 Subject 欄位中包括使用者識別的 LDAP 語法進行使用者驗證,此過程稱為客戶端憑證驗證 (Client Certificate Authentication,CCA),此時 SAS 9.4 若要進行外部網頁使用者驗證的雙向 SSL 則必須透過 Tomcat 進行客制化開發實作。

總結雖然 SAS 9.4 平台可以針對企業和組織的安全政策和需求設定 SSL 安全通訊協定的實作,但是安全機制的設定並非簡單的設定,有時會需要花費更多時間客制化開發實作才能夠完成。

相關資源