Page 115 - Vol.33
P. 115

Tech
 Notes
 技術專文


 圖5、機器學習分類與其常見演算方法(by J.P. Morgan Macro QDS) [8]  圖 6、利用主成分分析進行高維異常檢測分析─以離心式泵浦為例


                  Type           Technique     Complexity  Input Data Type  Number of variables  Considers time   Output
 Machine Learning / Artificial Intelligence                                         dimension


 Other            High-dimensional   Pricipal Component   Low  Sensor  1-1000s      No          Anomaly score
 Supervised Learning  Unsupervised Learning  Deep Learning
 Approaches       Anomaly Detection  Analysis (PCA)
                   Centrifugal Pump        Input Data Type = Sensor  Principal Component Analysis (PCA)  Anomaly Score
 Factor  Reinforcement
 Regression  Classification  Clustering  Time Series  Unstructured
 Analysis  Learning
                                       Date  Time  Pressure  Temp  Amps    Temperature
 Multilayer Perceptron (MLP)  Semi-Supervised  -  -  25  154  220               PC2
 Lasso, Ridge,  Logistic, SVM,  K-means,  PCA, ICA  Convolutional Neural Nets (CNN)  -  -  25  154  220
 Loess, KNN,  random Forest,  Birch, Ward  Long Short-Term Memory (LSTM)                        24
 Spline, XGBoost  Hidden Markov  Spectral Cluster  NMF  Restricted Boltzmann  Active Learning  -  -  25  154  220  PC1
 Machine (RBM)
                                       -   -     25     154  220       Amperage  Pressure
                                       -   -     25     154  220
                 Pump operates at a       3 variables, but could be 1000s  Each data point (   ) plotted  The higher the score,
                 constant 1500 RPM        Does not consider the time  represents a unique combination of  the greater the chance
                 Operating Mode = Single  dimension                 temp, pressure & amps   it is an anomaly
                 Pump is On or OFF
 行學習一般,即是「機器學習」  美國發電廠效率提升與運轉管理  據的應用,即時回傳水庫與河川液
                  說明:輸入離心式泵浦壓力、溫度與電流數據,利用PCA作權重分析,獲得異常分數值(Anomaly Score),分數越高異常的機會越高。
 (Machine Learning),同時也是弱人  目前在全球工業界中大數據的應用  位,依照液位高低控制水庫閥門作  資料來源: IBM Global Business Services
 工智慧(Weak AI)的代表。近年來,  較普遍使用在產品良率改善、廠房  動,有效的操作減少了許多災情發
 人工智慧常用於人臉辨識、異常偵  效率提升與客戶訂單預測。首先,  生,而每次的事件資料收集也將會
 測與搭配大數據分析之行為與效能  我們以廠房運轉效率提升為例:美  成為未來預測災害的重要基礎。
 [7]
 預測等等 ,已漸漸地改變人類的  國坎薩斯州勞倫斯市與當地工程
              了能夠找到主要影響該設備故障的                 性,並提供了降低運營成本的方                   工智慧進行大數據分析與預測,並
 生活。  公司Black  and  Veatch合作,利用  廠務系統應用案例  變數作為預測的指標,最終能將訓  法。未來可利用傳感器即時測量系    提供運算與開發平台所需之軟體,
 Black and Veatch Asset 360軟體
 機器學習普遍可分為四類,  然而,對於廠務系統而言,大數據  練好的模型作為預知保養的利器     統的水質與水量,如pH、氧氣、營            期望未來可作為PM管理平台的延
 之智能分析功能,優化當地電廠發
 如   圖5  [8 ]  所示:監督式學習  分析是否能有所應用呢?在水處理  圖6。  養物質、磷酸鹽、硝酸鹽、污泥乾                 伸,增加其在PM管理的多元性與
 電站的運作效率、分析計算電廠之
 (supervised  learning)、非監督式學  系統中,最重要的設備無非是負責  另外,在水質處理系統管理方面,  燥度、病原體等變量,搭配正確的  功能性,進而達成水處理系統效能
 運轉成本與影響成本之肇因,透過  輸送水的泵浦與水質淨化的濾材設             人工智慧演算法,使數據可進一步
 習(unsupervised  learning)、深度學  芬蘭的造紙企業凱米拉(Kemira)公                            最適化與設備預知保養的目的。
 這些利用智能分析系統的主動判斷  備,是否能利用既有的數據做到智             用於持續優化泵浦運轉的能耗以及
 習(Deep  learn-ing)與其他方法(增  司,在2017年即有應用大數據分                                   首先,以氣體洗滌塔回收系統
 或提出建議,使決策者做出更明  慧管理呢?工業界在轉動設備方面              化學品的使用量。經過這種優化過
 強式學習-reinforcement  learning  [11][12]                                        (Local  Scrubber  Reclaim  System,
 智正確的決策  。另外,Black   的預知保養的應用較多,依照設備  析來使得水處理系統的管理更加智  程,可最適化系統的操作並將操作
 與半監督式學習-Semi  supervised   慧化與有效率之案例 [11][15] 。以此案                            LSR)為主要研究對象,針對此系
 and  Veatch也有與勞倫斯市政府單  屬性的不同,已有定義出不同指標       成本合理化,同時仍然符合排放水
 learning)  [4][9] 。監督式學習為將每筆  位合作開發用於汽電共生與活性污  做為故障發生的先期指標,較常見  例經驗來說,凱米拉公司認為:造  之法規需求。  統之濾材處理效率與轉動設備運轉
 數據標記(Label),讓機器學習分類  泥系統的效能預測工具,使工廠管  紙業的廢水處理流程大部分都屬於                         狀態進行研究,但非耗材類設備之
 的為泵浦之振動頻率、運轉電流、
 (Classification);反之,非監督式學  理人員能夠優化營運。最初開發的  高能耗與高化學品使用量的操作,  透過以上文獻回顧與案例研究,我  維護(如變頻器內部元件監測或電
 運轉溫度等  [14] ,透過這些數據的
 習則為讓機器自行透過數據的特徵  工具已率先用於發電廠的污水處理  這樣的操作對環境較為不友善;同  們認為要達成廠務水系統的運轉效            盤內部元件)並不再此次研究範圍
 蒐集並用以統計學與大數據分析,
 (Feature)進行分類(Clustering)。每  設施,預計未來將會擴展應用到整  時,對於處理流程的控制與調整,  能最適化與設備預知保養之智慧管  內。我們藉由傳感器量測水的導電
 除了可能獲得工程師經驗已知的
 種學習方式都有其常用之演算法,  個城市的水處理設施。  如曝氣泵運作時間或是化學品加藥  理,需結合大數據分析與人工智慧                 度、氟離子濃度、酸鹼度、流量計
 結果,也有可能發現造成故障的新
 如監督式學習的支持向量機(SVM)  量等參數,大多是基於定時人為            將廠務水系統運轉優化,期望可將                  與壓力計等水質資料,進行濾材處
 變數。如較成熟之轉動設備頻譜分
 與K-鄰近演算法(KNN)  [10] ,與非監  水務單位應用於河川防汛與水資源  析,在過去是需要透過人為進行數  取樣量測數據與重複的實驗來進行  非預期性保養的發生降至最低同時  理效率的探討;另一方面,我們會
 督式學習的k-均值(k-means)演算  管理  據分析與判斷,找到最可能的異常  判斷,因此工程師為了符合放流水  也減少運轉成本。          聚焦於此系統的轉動設備-泵浦,
 法與主成分分析法(PCA)等等。如  另一方面,大數據分析應用於政府  原因,但其缺點是人為判斷不一定  質標準,常常會發生過度曝氣和過          導入運轉時數、運轉頻率、振動量
 何決定學習方式與演算法,將影響  水利部門水資源管理的策略 [2][13] ,  永遠是正確的,且通常嚴重的故障  量加藥的狀況。為了改善此狀況,     測數據與運轉電流,以既有量測數
 這個模型預測的效果,一般而言資  無論在國內外皆有一些案例正在開  都非單一肇因,用人為分析較可能  凱米拉公司進行了大量的研究並開            據進行分析,找到可能減少非預期
 料科學家會依照數據與研究對象的  發進行中,其主要概念為整合水庫  忽略掉第二或第三個原因,讓故障  發一種新工具可以非常準確和迅速 研究方法       性保養的機會點。
 特性找尋合適的演算法使用建立模  液位、降雨量資訊、河川液位、用  無法根本解決導致容易再發。針對  地在幾秒鐘內預測水處理廠污泥的
 型,並透過調整參數最佳化將預測  水總量數據與污水處理納污量等等  多變數之異常分析,常見的統計學  性質,通過整合現有的運轉數據、
 準確度提升。  數據,並利用大數據進行分析,提  與機器學習之手法為主成分分析法  歷史過程數據、機器設備數據和化  研究計畫               研究流程步驟
 供政府相關單位調度資源與政策的  [7] ,為利用演算法找出最有影響的  學分析數據,並搭配當地水處理廠  本研究與成功大學工程科學研究所         研究流程相關說明如  圖7所示。第
 [2]
 擬定及執行 。舉近年來台灣水利  幾個特徵參數來做分類器模型的訓  進行測試。該工具的主要優點在於  與IBM大數據分析與高級分析優化           一階段是決定研究目標與對象,
 大數據分析結合人工智慧於工  署提出之智慧水資源管理應用於防  練,就可能用數據客觀的檢視造成  讓操作者可更好地區別和了解影響  部門合作,以廠務水處理回收系統  第二階段則是收集SCADA回傳數
 業界的應用  汛工程為例  [13] ,結合物聯網與大數  故障的原因,並確實解決問題。除  污泥乾燥的關鍵條件以及其化學特  之運轉數據做為資料來源,利用人  據、水質取樣數據、設備保養紀



 114                                                                                 FACILITY JOURNAL          DECEMBER  2018  115
   110   111   112   113   114   115   116   117   118   119   120