Page 67 - Vol.17
P. 67
圖五、期刊文獻分類系統架構規劃
文獻瀏覽 待分類 文獻收集 Internet
使 模組 模組
用 文獻
User 者
介
面 文獻分類
己分類 模組
文獻
主題類別樹
類別回饋 分類優化
模組 模組
首先,專家針對其專長定義主題及 篇文獻,每 10 篇文獻約有 2~3 篇 術實際運用於新廠建立及廠務運轉
主題類別,並協助提供各類別之相 真正符合需求。透過前述的文件分 等日常工作中,透過專家訪談及工
關文件,透過監督式學習法建立分 類應用,除了文獻收集符合使用者 作小組討論,規劃系統發展的方向
類模型。接著文獻收集模組根據事 需求外,視覺化的知識分布呈現, 及目標,將發想有計畫的執行,使
先設定好之主題及期刊來源,自動 更使同仁在短時間內即可存取到主 之成為未來新廠建立及廠務運轉上
從網際網路中收集與主題相關之文 題相關文獻。 一項獲取新知的利器。
獻,並儲存於待分類文獻庫中。文
從龍捲風科技─中文搜尋引擎的領
獻分類模組隨後運用自然語言處理
導者,於 2014 年底提供之新聞文
及文件分類技術,自動分析各文獻 章與節能主題文獻實測資料顯示, 註腳
之特徵 ( 例如關鍵字 ),並決定文 當訓練文件數為 200 時,透過監督 [1] 收集 10 篇相關文獻需過濾 10/(3/10)=
獻所屬類別。 式學習法建立之分類模型準確度達 34 篇文獻,每篇花費 5 分鐘,共需花費
34×5=170 分鐘
文獻瀏覽模組提供文獻分類瀏覽功 85%,亦即每 10 篇文獻即有 8 篇 [2] 收集 10 篇相關文獻需過濾 10/(8/10)=
13 篇文獻,每篇花費 5 分鐘,共需花費
真正符合需求。比較過去關鍵字搜
能,使用者透過瀏覽器即可瀏覽主 13×5=65 分鐘
尋方式,同仁收集 10 篇相關文獻
題相關文獻及文獻分布等資訊。若
1
需花費約 170 分鐘 ,導入文件分
使用者在瀏覽的過程中發現文獻類 參考文獻
類應用後,收集 10 篇相關文獻僅
別有誤,可進一步透過類別回饋模
2
需花費約 65 分鐘 ,省下約 62% [1] 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、
組提供類別修正回饋。其後,系統 王慶堯,資料探勘,旗標出版,台北
的時間,且過程中可直接針對主題 (2005)。
利用收集到的回饋資訊,透過分類
相關文獻進行瀏覽,不需事先鍵入 [2] Changchun, Y., and Li, Y., “A data
優化模組將文件分類模型進行修 mining model and methods based
關鍵字。 on multime dia database ”, 2010
正,藉此提升文獻分類之準確度。 International Conference on Internet
Technology and Applications, pp. 1-4
預期將上述系統應用於知識管理中 (2010).
能夠達成的效益如下: [3] Hong, S., Han, X., Tian, L., and Luo,
L., “An automatic classification system
– 加速資訊收集:透過視覺化知識 結論 for the stock comments”, The 9th
International Conference onComputer
分布及資訊呈現,提供同仁快速 Science & Education, pp. 89-92 (2014).
[4] Li, C., and Zhou, J., “Semi-supervised
且精確的參考資訊。
weighted kernel clustering based on
本文旨在介紹常見的分類技術,以 gravitational search for fault diagnosis”,
– 聚焦重點文獻:自動文獻關聯性 ISA Trans, Vol. 53, No. 5, pp. 1534-
及文件分類技術於知識管理的應用
建立及主題相似文件推薦,協助 1543 (2014).
發想,藉以說明如何運用分類技術 [5] Kotsiantis, S.B., “Supervised machine
使用者快速聚焦重點文獻。 learning: a review of classification
於提升知識管理的應用層級。文件 techniques”, Informatica, vol. 31, pp.
– 促進知識交流:藉由新知研讀、 分類於知識管理的應用有助於精確 249-268 (2007).
[6] Umamaheswari,U., and Shivaji Rao,
評論及心得交換促進知識分享。 的收集到相關的資訊,以及知識收
G., “An efficient way of classifying and
集效率的提升,進而增進同仁核心 clustering documents based on SMTP”,
初步訪談資料顯示,過去透過 International Journal for Research
知識與技術的提升。
Google 關鍵字搜尋的文獻收集方 in Applied Science & Engineering
Technology (IJRASET), Vol. 2, No. 6,
式,同仁平均需花費 5 分鐘過濾 1 新工目前正在發展導入文件分類技 pp.18-23 (2014).
NEW FAB ENGINEERING JOURNAL MARCH 2015 67