Page 116 - Vol.33
P. 116

Tech
             Notes
             技術專文

            錄、耗材更換紀錄與設備故障歷史
                                             圖7、研究流程說明圖                                                                              表 2、模型選定分類                                       表 3、模型 1 (KNN+ 標籤分兩類 ) 混淆矩陣結果
            紀錄等相關運轉數據,並補足可能
            會缺乏的資料點。第三步為資料分                                                                                                                                                             總和準確率:           預測數據
                                                                                                                                                     標籤分兩類(0,1)     標籤分三類(0,1,2)
            析與數據處理,定義可能會造成機                        研究階段                          研究流程                                                                                                   0.976
                                                                                                                                                                                                         0        1       Total
            器誤判的雜訊,並完成數據特徵標
                                                                                                                                       KNN演算法        模型1            模型2
            記(Feature  Label),以利後續模型
                                                  研究目標確立                     確立研究目標與對象                                                                                                  實際      0        18653    152     18805
            的建立。完成資料處理後,接著是                                                                                                            DT演算法         模型3            模型4                 數據
                                                                                                                                                                                                1        315      342     657
            演算法選用與模型建立,將其中
                                                                                                                                       RNN+LSTM演算法   模型5            模型6                         Total    18968    494     19462
            百分之八十的數據用以機器訓練                         資料收集          設備故障       SCADA     採樣水質      設備保養/
            (Training),剩餘百分之二十用於                                 歷史紀錄        數據       檢測數據     耗材更換紀錄
            結果驗證與預測(Predicting),選擇                                                                                                   表 4、模型 2 (KNN+ 標籤分三類 ) 混淆矩陣結果                                    表 5、模型 3 (DT+ 標籤分兩類 ) 混淆矩陣
            預測結果較好的模型並進行後續的                                                                                                                                                                               結果
                                                                                數據前處理
            參數調整與最佳化。第五階段為模                        資料處理                                                                                總和準確率:             預測數據                                          總和準確率:    預測數據
            型的應用,將各種收集的數據可視                                                  資料特徵觀察與定義                                                 0.962              0        1          2          Total          0.97      0      1    Total
            化,可視化後更便於人類或是機器
            進行參數之間關聯性分析,藉此我
                                                   模型建立                        建立預測模型
                                                                                                                                       實際數據       0       15757    152        20         15929          實際   0    18531  252  18783
            們可以進一步找到關鍵參數以作為                                                                                                                                                                             數據
            預知保養的指標。最後針對本研究                                      預測模型最佳化       建立水系統預知       資料與預測結果                                              1       339      372        9          720                 1    329    350  679
                                                   模型應用           /結果驗證        保養關鍵參數           可視化
            結果討論,提出推廣至其他廠務系                                                                                                                       2       92       15         30         137                 Total  18860  602  19462
            統的可行性與未來展望。
                                                 結論與未來建議                     結論建議與未來展望                                                            Total   16188    539        59         16786
            因受限於本次研究內容導入的資                                                                                                                                                                            表 7、模型 5 (RNN+ 標籤分兩類 ) 混淆矩
            料量較少,僅2017年數據用於模                                                                                                                                                                              陣結果
            型建立,與2018上半年數據用於                                                                                                         表 6、模型 4 (DT+ 標籤分三類 ) 混淆矩陣結果
                                                                                                                                                                                                        總和準確率:    預測數據
            驗證結果,結果準確度不一定可                   圖8、建立預知保養模型之流程圖                                                                                                                                            0.881
                                                                                                                                       總和準確率:             預測數據                                                    0      1    Total
            以達百分之百,故希望能將建立預
                                                                                                                                       0.95
            測模型之流程標準化,作為提供未                                                                                                                               0        1          2          Total
                                                  訓練(Training)
            來相關廠務系統預知保養模型開                                                                                                                                                                              實際   0    16519  2231  18750
                                                    訓練數據           特徵擷取           模型訓練         完成訓練                                                                                                     數據
            發之標竿。  圖8為本研究建立預知                      (Training Data)  (Feature Extration)  (Train the Model)  的模型                        實際數據       0       15633    246        82         15961               1    94     618  712
            保養模型之流程,模型的建立分
                                                    資料標籤                                                                                          1       278      377        33         688                 Total  16613  2849  19462
            為兩階段-訓練(Training)與預測                     (Labels)
                                                                                                                                                  2       78       21         38         137
            (Predicting)。訓練階段將訓練數據
            導入並完成資料標籤,讓機器學習                                                                                                                       Total   15989    644        153        16786
                                                  預測(Predicting)
            資料的特徵並加以訓練,完成初步
                                                     新資料           特徵擷取           模型預測         資料標籤
            的模型;預測階段把新的資料導入                         (New Data)  (Feature Extration)  (Prdicting)  (Labels)                                                                                            分,實際為「1」且預測為「1」,
            模型,經過模型判斷其特徵後產出                                                                                                          表 8、模型 6 (RNN+ 標籤分三類 ) 混淆矩陣結果                                    代表成功預測需要保養的狀況,
            預測分析結果。完整的模型需要多                                                                                                                                                                           其準確率為52%,而實際為「1」
            次的驗證與訓練,並非一蹴可及,                                                                                                            總和準確率:             預測數據                                        且預測為「0」的部分,為需要保
                                                                                                                                       0.838
            資料量越是足夠,則預測的準確度                                                                                                                               0        1          2          Total        養但預測為正常的狀況,數量為
            越高。                                                                                                                                                                                       315筆。最後,總和準確率則是表
                                             而壓差則是由入、出口壓力獲得;                 網路(Recurrent  neural  network,                                                                                           示模型1完全預測正確的比例,即
                                                                                                                                       實際數據       0       13533    2366       82         15981
                                                                                  [18]
                                             在本研究中,我們並非告訴機器既                 RNN)   演算法做初步的比較。                                                                                                        (18653+342)/19462=0.976,故
            資料前處理與模型選定                       有的更換條件,而是將數據分為正                 由   表2中的六個組合建立模型,                                                    1       140      495        33         668          模型1的總和準確率為97.6%。
                                             常(0)、保養前五天(1)、保養當日              比較其預測之準確度。在機器學                                                       2       21       64         52         137
            開始訓練機器之前,將蒐集的資料                                                                                                                                                                           表3至 表8為模型 1到模型 6的預測
                                             (2),讓其自動去學習將相關數據                習中,模型的準確可由混淆矩陣
            參數進行分類,即所謂的「貼標                                                                                                                        Total   13694    2925       167        16786        結果與準確率,比較模型1與2,可
                                             進行分類,並分辨該筆數據是屬於                 (Confusion Matrix)來評定,選擇準
            籤」(Label),我們必須先定義正                                                                                                                                                                        看出標籤分類的方式對於準確率的
                                             哪種狀況(亦即分辨正常、保養前                 確率高之適用模型後,再導入預測
            常資料與異常資料,才能使得機器                                                                                                                                                                           影響,在模型2中,標籤分三類的
            學會判斷。以逆滲透膜的處理效能                  五天與保養當日)。另外在演算法                 資料確認模型的可靠度與後續的分                                                                                                          準確率較差,原因可能為保養當日
            為例,目前廠務工程師通常會依據                  的選用,因資料量偏少與資料變數                 析。                                                      表格的判讀方式如下說明:當實際                  確率達99.2%,而實際為「0」且               (2)的數據量較少,對於機器學習
            膜的離子去除率與壓差判斷是否需                  較少的緣故,使用較常用的K-鄰近                由模型1的混淆矩陣來說明  表3,                                       為「0」且預測為「0」,代表實                  預測為「1」,代表實際上正常但                 上樣本數不足,故在標籤分類的部
            要進行更換保養,與去除率相關的                  (KNN)演算法   [16] 、決策樹(Decision   X方向為機器預測的結果筆數,Y                                         際上為正常且預測結果同為正常,                  預測錯誤的資料,數量為152筆;                分我們認為分成正常與更換前五天
            參數為逆滲透膜入、出水導電度,                  tress,  DT)演算法   [17] 與循環神經     方向代表實際上輸入的數據筆數,                                         其資料數量為18653筆,預測準                 另一方面,在預測保養前五天的部                 兩類較好。接著比較三種演算法之



            116                                                                                                                                                                                              FACILITY JOURNAL          DECEMBER  2018  117
   111   112   113   114   115   116   117   118   119   120   121