Page 67 - Vol.17
P. 67

圖五、期刊文獻分類系統架構規劃





                                文獻瀏覽        待分類        文獻收集       Internet
                            使     模組                    模組
                             用               文獻
                     User    者
                             介
                             面              文獻分類
                                 己分類         模組
                                  文獻
                                                      主題類別樹
                                類別回饋        分類優化
                                  模組         模組







              首先,專家針對其專長定義主題及                  篇文獻,每 10 篇文獻約有 2~3 篇            術實際運用於新廠建立及廠務運轉
              主題類別,並協助提供各類別之相                  真正符合需求。透過前述的文件分                 等日常工作中,透過專家訪談及工
              關文件,透過監督式學習法建立分                  類應用,除了文獻收集符合使用者                 作小組討論,規劃系統發展的方向
              類模型。接著文獻收集模組根據事                  需求外,視覺化的知識分布呈現,                 及目標,將發想有計畫的執行,使
              先設定好之主題及期刊來源,自動                  更使同仁在短時間內即可存取到主                 之成為未來新廠建立及廠務運轉上
              從網際網路中收集與主題相關之文                  題相關文獻。                          一項獲取新知的利器。
              獻,並儲存於待分類文獻庫中。文
                                               從龍捲風科技─中文搜尋引擎的領
              獻分類模組隨後運用自然語言處理
                                               導者,於 2014 年底提供之新聞文
              及文件分類技術,自動分析各文獻                  章與節能主題文獻實測資料顯示,                 註腳
              之特徵 ( 例如關鍵字 ),並決定文               當訓練文件數為 200 時,透過監督              [1]  收集 10 篇相關文獻需過濾 10/(3/10)=
              獻所屬類別。                           式學習法建立之分類模型準確度達                    34 篇文獻,每篇花費 5 分鐘,共需花費
                                                                                  34×5=170 分鐘
              文獻瀏覽模組提供文獻分類瀏覽功                  85%,亦即每 10 篇文獻即有 8 篇            [2]  收集 10 篇相關文獻需過濾 10/(8/10)=
                                                                                  13 篇文獻,每篇花費 5 分鐘,共需花費
                                               真正符合需求。比較過去關鍵字搜
              能,使用者透過瀏覽器即可瀏覽主                                                     13×5=65 分鐘
                                               尋方式,同仁收集 10 篇相關文獻
              題相關文獻及文獻分布等資訊。若
                                                                1
                                               需花費約 170 分鐘 ,導入文件分
              使用者在瀏覽的過程中發現文獻類                                                  參考文獻
                                               類應用後,收集 10 篇相關文獻僅
              別有誤,可進一步透過類別回饋模
                                                               2
                                               需花費約 65 分鐘 ,省下約 62%             [1]  曾憲雄、蔡秀滿、蘇東興、曾秋蓉、
              組提供類別修正回饋。其後,系統                                                     王慶堯,資料探勘,旗標出版,台北
                                               的時間,且過程中可直接針對主題                    (2005)。
              利用收集到的回饋資訊,透過分類
                                               相關文獻進行瀏覽,不需事先鍵入                 [2]  Changchun, Y., and Li, Y., “A data
              優化模組將文件分類模型進行修                                                      mining model and methods based
                                               關鍵字。                               on multime dia database ”, 2010
              正,藉此提升文獻分類之準確度。                                                     International Conference on Internet
                                                                                  Technology and Applications, pp. 1-4
              預期將上述系統應用於知識管理中                                                     (2010).
              能夠達成的效益如下:                                                       [3]   Hong, S., Han, X., Tian, L., and Luo,
                                                                                  L., “An automatic classification system
              – 加速資訊收集:透過視覺化知識                結論                                  for the stock comments”, The 9th
                                                                                  International Conference onComputer
                分布及資訊呈現,提供同仁快速                                                    Science & Education, pp. 89-92 (2014).
                                                                               [4]   Li, C., and Zhou, J., “Semi-supervised
                且精確的參考資訊。
                                                                                  weighted kernel clustering based on
                                               本文旨在介紹常見的分類技術,以                    gravitational search for fault diagnosis”,
              – 聚焦重點文獻:自動文獻關聯性                                                    ISA Trans, Vol. 53, No. 5, pp. 1534-
                                               及文件分類技術於知識管理的應用
                建立及主題相似文件推薦,協助                                                    1543 (2014).
                                               發想,藉以說明如何運用分類技術                 [5]   Kotsiantis, S.B., “Supervised machine
                使用者快速聚焦重點文獻。                                                      learning: a review of classification
                                               於提升知識管理的應用層級。文件                    techniques”, Informatica, vol. 31, pp.
              – 促進知識交流:藉由新知研讀、                 分類於知識管理的應用有助於精確                    249-268 (2007).
                                                                               [6]   Umamaheswari,U., and Shivaji Rao,
                評論及心得交換促進知識分享。                 的收集到相關的資訊,以及知識收
                                                                                  G., “An efficient way of classifying and
                                               集效率的提升,進而增進同仁核心                    clustering documents based on SMTP”,
              初步訪談資料顯示,過去透過                                                       International Journal for Research
                                               知識與技術的提升。
              Google 關鍵字搜尋的文獻收集方                                                  in Applied Science & Engineering
                                                                                  Technology (IJRASET), Vol. 2, No. 6,
              式,同仁平均需花費 5 分鐘過濾 1               新工目前正在發展導入文件分類技                    pp.18-23 (2014).
                                                                              NEW FAB ENGINEERING JOURNAL          MARCH  2015  67
   62   63   64   65   66   67   68   69   70   71   72