Page 6 - Vol.45
P. 6
Tech
Notes
技術專文
或災害發生情事。然而這種高度仰賴人員介入的操作機制,長 Learning) ,實現機器學習模型在長期服務維運中的持續訓
[10]
期來看除了需投入的大量人力的操作,一旦人員的專注意力因 練(Continuous Training)與持續整合(Continuous Integration)
疲勞而下降,遺漏通報或通報延遲的狀況恐難以避免。單純仰 效果。並透過合適的使用者操作介面與操作體驗設計(UI/UX
賴人力的作業機制也無法在擴大場域中有效規模化的執行,因 design),實現工安偵測應用中對於PPE(Personal Protective
此需要一自動化且智慧化的工地影像監控系統,協助值班監控 Equipment)穿戴及高風險區域的侵入偵測,提出輔助監控人員
人員從鉅量的影像中,快速過濾高度職災風險的畫面。 的自動化辨識系統。有效降低「從高處墜落」及「物體飛落砸
另一方面,隨著多媒體平台及IoT(Internet of Things)聯網 傷」等工地職災成因。
裝置的普及,包含影像、聲音或是感測數據等資料型態,每日 本文後續章節安排如下 : 第二章重點說明相關背景知
皆以鉅量之規模產出,提供豐富的人工智慧訓練資料。加上具 識,包含深度學習模型中的卷積操作運算及深度物件偵測模
快速平行化運算能力及高效存取頻寬的GPU裝置,其製造技術 型類型簡介,說明影像樣態識別及物件偵測的原理。同時亦
與成本皆不斷優化,即便是一般的研究學者或技術人員皆可輕 會介紹互動式學習、遷移學習,以及MLOps等核心概念。第
易取得高效且經濟實惠的運算力。基於上述兩點加速深度學 三章將介紹本篇論文針對PPE穿戴及高風險區域侵入偵測,所
習類神經網路(Deep Learning Neural Network, or DNN)技術自 引用的深度學習模型設計方法、系統的UI/UX設計,以及針對
[03]
2012年開始蓬勃發展 。深度學習類神經網路之所以具有超強 MLaaS為目標所設計的MLOps流程。第四章我們來自工地現
的資料擬合及學習能力,即在於將傳統機器學習方法中對資 場所收集的CCTV系統影像進行準確率及效能評估實驗。第五
料施以特徵工程及特徵選取(Feature Engineering and Feature 章則對本篇論文的重要發現進行綜整並提出未來可持續強化
Selection)過程 [04] ,直接整合到層層疊加的類神經網路模型 的系統開發方向。
中,並透過損失函數的設計,創造端到端學習(End-to-End
Learning)的模型優化機制,在訓練的過程中,學習算法便可自 2. 文獻探討
動為類神經網路模型,擬合出具有高度鑑別力的特徵向量。目
2.1 深度卷積類神經網路及卷積運算(Convolution Neural
前深度學習已被證明在越是純粹、低階的資料及訊號,例如 :
Network & Convolution Operation)
[03]
影像、聲音、感測數值及文字中取得高度的成功 。自2015年
的ILSVRC國際圖像識別競賽開始,深度學習於影像識別應用 受惠於近年高效能GPU運算裝置及鉅量資料的蓬勃發
[05]
的準確率,更是一舉突破了人類辨識能力的平均水準 。因此 展,多樣且新穎的機器學習資料分析方法得以發展,並促成
近年來透過深度學習影像分析技術,偵測攝影機畫面中之物 了目前大眾所認知的深度學習神經網路(Deep Learning Neural
件,例如 : 安全帽、安全反光背心、危險區域環境等,已被多 Network)架構。圖1⒜突顯了傳統機器學習方法及深度學習網
[11]
所應用於工地安全監控維護的應用上 [06][07][08] 。 路概念上的差異 。傳統的機器學習方法,在特徵擷取(feature
然而如同之前所述,有別於其他場域的影像識別應用環 extraction)上需要專家基於領域知識(domain knowledge)設計
境多屬相對穩定、少有變化的環境。隨著工程進度的推展,工 或是透過統計檢定選取特定指標,進行人工特徵的合成(hand-
地環境樣貌變遷速度不只快,同時變化幅度劇烈,往往深度學 crafted feature engineering)。這樣分二階段的作法對於後續預
習模型甫剛訓練完上線,就得面對影像辨識或物件偵測應用中 測模型的建立,雖然可以提供快速的引導及收斂,然而以現有
的「前景物件」或「背景影像」已跟訓練資料集的分佈狀況, 的專家知識出發,某方面來說也剔除了一些模型原本可探索的
有大幅度變化的問題。這些都會使深度學習模型上線後的準確 方向,以綜觀來看未必就能找到全域最佳解。另一方面,深度
率及模型的有效期間大打折扣。過往所發表深度學習應用於工 學習模型強調不仰賴專家產生的特徵值做為模型輸入,而是嚐
地影像安全偵測之論文,往往著重在影像辨識或物件辨識中對 試堆疊多層的神經元運算,串接前面淺層的神經元運算輸出,
工地人員行為、穿戴裝備、車輛機具的辨識進行命題及實驗, 成為後面深層神經元運算的輸入。當堆疊超過一定的深度時,
卻少有談論因應工地環境快速變遷,如何以自動化、有效率的 深度學習演算法為了擬合模型最後輸出的結果,使其與分類目
方式持續監督及改善模型效能下降的問題。 標一致,各層神經元中的參數,自然就會演變為重要的特徵
有鑑於此,對於深度學習影像識於工地安全強化的討 值,整個學習的過程實現了自動化的特徵工程機制(automated
論,我們將從單純模型建立的角度,向上提升至建立長期、 and learning-based feature engineering),這不只是大大克服
穩定的服務流程。本篇論文提出MLOps的概念,規劃適 了機器學習研究學者在跨足不同領域應用時缺少專家知識的困
合於工地工安監控人員長期操作的服務維運流程(Machine 難,同時也讓人工智慧有了挖掘既有專家經驗以外新知識的機
Learning as a Service, MLaaS)。MLOps意即將系統開發及維 會,進一步提升了模型預測效能。
運(Development and Operations)的DevOps流程,透過機器
學習裡的互動式學習(Active Learning) 及遷移學習(Transfer
[09]
4