Page 34 - vol.49
P. 34
VOL.49 廠務季刊 萬物齊漲新對策 - 專案發包變革
圖 5:Corpus-based 中文語音合成系統基本流程圖 ( 資料來源:以語料庫為基礎之中文文句翻語音系統中合成單元之
選取,吳佩穎,2005)
預算不足及物價過高解決方案探討
3.1 標單比對數位化 - 縮短比價、發包時間及提高項目單價漲幅正確性
議價前,為求比價結果準確性,與前專案比價須先比 提高資料品質,預計先從 character-based 的文字比
對前後專案標單各工程內容是否一致,相同工程項目 對方法著手,目標搜索出因人為打字因素所造成字串
才能夠進行比價,不同專案工程項目變動很大,雖然 結構差異的相似字串,得到與目前輸入的品項最接近
既有系統上已有自動比對標單之功能,但其比對準確 的過往紀錄。第二部分將針對公司現有的文字比對演
率極低,因此大部分 package 還是人工逐筆比對。 算法進行修正或重新設計,並畫出資料庫的欄位關聯
數位比對系統藉由電腦程式自動比對以取代人工,縮 圖以釐清表格與表格之間的關聯性,如圖6 所示。
短資料作業時間,讓人力花在資訊分析與對策研究,
可大幅降低未來與廠商議價及發包時間。 運用資料庫設計與管理以及演算法設計的概念,釐清
目前資料庫的實體關聯性模型(Entity-Relationship
為達到有效的字串比對成果,與台大產學合作共同研 model、ER model)、 整 理 資 料 流 向、 重 新 定 義
擬開發新的比價系統,首先針對既有資料品質進行改 meta data、設計資料庫欄位、清理改善資料品質,
善;主要分為兩部分,第一部分將各廠歷史標單資料 並且參考幾項常用的文字比對演算法,例如計算萊文
建立資料庫並針對歷史資料庫架構與設計做檢驗修正 斯坦距離等,改良公司既有比對演算法程式,預期成
動作,例如表格之間的關聯性、欄位增減、欄位 meta 果包含 : ➀改善並訂定標準以維護後續資料品質;➁
data 精準定義等,另清理目前之歷史資料,包含統一 改善過的資料能在現有的演算法底下提升比對效果;
標點符號的使用、修正手動輸入的錯誤、統一用詞等 ➂改良比對演算法,使系統表現更貼近使用者預期。
��