Page 77 - Vol.35
P. 77

Tech
 Notes
 技術專文

 互間之能耗方程式,因此無法反應
 圖1、Google某座資料中心導入AI-ML之冰水系統前後的PUE  圖2、Tensorflow 基本架構圖        圖4、Relu函數
 出設備之實際狀況,在節能上相信
 還有空間;所以本研究將尋求新技
                                                                 10
 術的方法來深入探討更多的節能機
                  X = 10                                          8
 會。  High PUE  ML Control On  ML Control Off
                                                                  6
 冰水系統的溫度改變與基礎設備            +       z = 18                         4
 (冰機、冷卻水塔、熱回收、泵等)
 下降40%             y = 8                     /      b = 2         2
 的負載變化呈現出非線性的複雜
                                                                  0
 相關性,外氣條件也會影響冰水                    a = 9
                                                                 -2
 系統的耗電效率,如此高維度與                                                    -6    -4     -2    0      2     4     6
 複雜度的系統,以傳統理論公式的  Low PUE
 預測建模(如正負2℃)通常難以捕
 獲這種複雜的相互依賴性,且於實
                                                                               此外,我們也引入了網路體系結構
 際運轉與理論有著不可避免的差  圖3、類神經網路結構圖
                                                                               的重要元素─激活函數(activation
 異因素存在,如運轉時間久造成
                                                                               function),在類神經網路中如果不
 效率變差、管路結垢摩擦損失變  首先提出採用人工智慧(AI)來有效  的sensor資訊,其冰水系統能耗更
                                  2 n                                          使用激活函數,那麼在類神經網路
 大…等。為了解決這些挑戰,我們  管理其數據中心基礎設施的冷卻操  甚於google許多,另外在冰水系統  n-1
 嘗試著運用大數據分析-人工智慧  作,該公司在2017年導入機器學  架構與google系統架構兩者相似度  Mini  2  2 n-2  MSE    中皆是以上層輸入的『線性』組
 (Artificial  Intelligence,  AI)的方法,  習(ML)的類神經(Neural  Network,   高,非常適合將此智能方法導入  batch  100  2 n-3  iteration  合作為這一層的輸出(也就是矩陣
                  Mini                                                         相乘),則輸出和輸入就脫離不了
 以實際運轉數據中分析找出與理論  NN)演算法,發展了一套智能系統  現行運轉於冰水系統的正負2℃模  batch  1     Real ECF
                  Mini
 之差異性。在人工智慧眾多的演算  來有效管理其數據中心基礎設施的  型,做進一步的能耗優化,所以在  batch  Output layer        線性關係,如此做深度類神經網路
 法中我們採用了機械學習(Machine   冰水系統操作 [1,2,3,4,5,6] ,這套智能  2018年初廠務與MTC合作,運用  Mini  Input layer  (Estimated ECF)  便失去意義。因為隱藏層中層與層
 Learning,  ML)演算法可較符合解決  冰水系統,不只是有效降溫了伺服  這方面相關技術並朝此方向研究。  batch  Hidden layers  的各個層面是透過激活函數轉換,
 目前的問題,因為機械學習演算法  器運作和網路傳輸過熱問題,更進                                              其功能是為系統帶來非線性,常
                                                                               見的激勵函數選擇有sigmoid,  tanh,
 擁有自我學習的優勢,是一類從運  一步將冰水系統的耗能達最小化。
 轉資料Big  Data中自動分析獲得規  在Google某座資料中心導入AI之                                      Relu,本文使用的是深度學習的主
 律,並利用此規律對未來資料進行  冰水系統前後PUE(Power  Usage  計畫方法  參數的『值』而忽略『單位』,結  以將數據、變數、運算符號指定為  流Relu 圖4 ,主要是為了舒緩過度擬
 預測的演算法,訓練出來的AI模型  Efficient)減少40%  圖1 ,此PUE值  果在不同單位之間會有很大差異,  特定圖形元素後做運算,且由於神  合(overfitting)和節省計算量兩個主
 可將系統因運轉時間久而造成效率  是用來計算資料中心節能省電的標  整體來說,我們使用的機器學型模  例如5kg和5000gms是同樣的重  經網絡實際上是數據和數學的圖形  要因素(對使用反向傳播訓練的類
 的改變,做即時調整及修正,期望  準,計算方式是以「資料中心的總  型是深度學習中常見的類神經網路  量,但因為單位不同而有1000倍  運算,因此TensorFlow非常適合神  神經網絡來說,梯度的問題是最重
 能將理論與實際差距最小化,而獲  用電量」除以「資料中心內IT設備  演算法。類神經網路演算法中,輸  的差異。為了預防這樣的變異性在  經網路和深度學習,以下舉一簡單  要的,使用sigmoid和tanh函數容易
 得更多之節能效益。  的總用電量」,PUE值越低代表機  入值和輸出值的定義是最初始的重  訓練過程中造成影響,則我們需要  的例子說明 圖2 。     發生梯度消失問題,是類神經網路
 房在環境監控、空調冷卻、燈光等                                                               加深時主要的訓練障礙)。
 點,台積公司和冰水系統相關的  將所有參數帶到相同的大小,這可
 周邊設備的用電量更少。  以通過縮放來完成。通常有四種執                 我們建構的深度學習類-反向傳播                  最後,我們要引入網路成本函數
 傳感器參數(sensor  tag)將近1000
 Google運用AI-ML並選擇類神經網  個,但並不是每一個參數都和耗能  行中縮放的方法,分別為標準化法  訓練神經網路模型架構中  圖3 ,將    (cost  function),在機器學習中,
 文獻探討  路演算法  [7,8,9,10,11,12,13] ,其主要原因  相關,首先,我們利用機器學習  (standardization)、均值歸一化法  冰水系統耗能相關參數(壓縮機、  成本函數用於估計模型的執行情
 為:  常用的feature  selection篩選出第  (mean  normalization)、極小極大縮  水泵、水塔、熱回收、冷凍噸、外   況,簡而言之,成本函數衡量模型
 冰水系統主要吸取從工廠設備及其  – 能快速學習和建立復雜關係中非  一波和耗能相關近300個參數,其  放法(min-max  scaling)、單位向量  氣條件)視為輸入神經元組,總耗  在評估和y之間關係的能力方面有
 周圍環境中排出的熱量,以降低設  線性的能力,因為在現實生活  次,透過廠務冰水系統專家的經驗  法(unit  vector),本文採用的方法  電量視為輸出神經元。中間層由數  多好或多差,目的為度量預測值與
 備和環境溫度。因為冰水系統耗電  中,輸入和輸出之間的許多關係  和專業,再精確篩選出近100個重  是極小極大縮放法。  個隱藏層組成,定義輸入層、隱藏  實際觀察值之間的偏差量。常見的
 量大,以往不論先進科技業或傳統  都是複雜的非線性關係。  要參數當成神經網路的輸入值。  機器學習包含監督學習,非監督  層和輸出層之間所需的變量維度很  的函數是均方誤差(MSE)函數,表
 產業,都是利用精進冰水系統技術  數據集收集每15分鐘一組,範圍  學習,深度學習和加強學習等,  重要,這影響著資料在訓練期間傳             示如下列方程式:其中n是樣品總
 – 模型學習之後,它可以推斷出數
 或優化冰水系統設備運作效率達節  共13個月且按時間順序排列共有  其中所涵括的演算法種類不勝枚  遞的順暢性,以經驗法則,第一層             數、Y是實際觀察值、y是度量預測
 據上看不見的關係,從而使模型                                     n
 能目的,往年這樣的冰水系統技  3.79M筆數據,將數據分為訓練群  舉,在此就我們所使用的深度學習  包含2 個神經元,略大於輸入參數          值。
 能夠預測看不見的數據。
 術改進確實使互聯網公司(例如:  和測試群兩群,訓練群包含總數據  之類神經網路演算法加以說明。  的兩倍,後續的隱藏層取決於前一
 – 與許多其他預測技術不同,類神
 google)提高資料運轉設備的用電  集的80%、剩餘20%是為測試群。  TensorFlow是處理數值運算和大  層的一半大小,簡單地說,就是每
 經網路不需對輸入變量施加任
 效率,但近年來由於改進的速度趨  訓練期間數據集並非原始資料,而  規模機器學習的開放式程式庫,目  個層將其輸出作為輸入傳遞給下一            對模型進行訓練期間多採用小批量
 何限制(例如它們規定應如何分
 於緩慢,為確保服務全球的龐大伺  是必須經過縮放(scaling)處理,因  前是深度學習和神經網絡計算框架  層。並且,在神經網路結構中,每       (Mini  batch)規模培訓,每一個小
 配),編寫自由度高。
 服器和計算資源網路必須保持最佳  為我們所選取重要參數的大小、單  的指標,通常透過Python控制。  一個耗能相關參數的權重(weights)     批都是由訓練群中亂數選取後分批
 的運轉條件,Google決定不再定  同時間,我們得知台積公司廠務  位、範圍有相當大的不同,假如不  TensorFlow是藉由利用圖形和圖形  和整體偏差變量(biases),初始由  送進網路系統,由第一批的MSE
 期投資新的冷卻技術來增加收益,  冰水系統不僅擁有比google更大量  管它們,這機器學習模型只會考慮  的運作來呈現運算過程,使用者可  默認值定義之。  得出相對應的權重和偏差變量,然



 76                                                                                 FACILITY JOURNAL          SEPTEMBER   2019  77
   72   73   74   75   76   77   78   79   80   81   82