基于數據抽取與訂閱實現數據共享分析及研究論文
1.引言
早期的應用系統的建設,大都存在缺少總體、全面、系統的規劃,缺乏統一的數據標準,相互之間資源難以共享的“信息孤島”。從而造成各部門提供的數據不夠完整、準確和權威。給全校范圍內信息的交流和共享帶來了障礙,同時產生了大量的冗余信息。因此,需要通過對各部門計算機應用系統進行統一規劃,利用底層整合的信息資源,為門戶、應用和信息資源整合提供數據交換、資源管理等基本服務接口,以實現各部門決策數據在應用層面的互聯互通和信息共享。
為了實現數據共享,需要建設數據中心存儲全校共享的數據。建設數據中心時,盡可能擴展數據的集成范圍,形成大而全的數據中心,作為全校數據統計分析、智能決策支持的權威數據庫;數據庫能集成到數據中心運行的應用系統盡可能集成到數據中心運行,數據中心可以成為后續開發各種應用系統的通用數據庫平臺;對于需獨立運行的應用系統,通過數據交換與共享服務平臺來實現數據的集成與共享;同時制定規范的數據變更流程,實現誰產生、誰維護、誰負責的權威數據源。
本文以我校數字化校園項目建設為例,重點介紹如何規劃好我校數據流,以及如何通過數據的`抽取與訂閱實現各業務系統數據共享。
2.數據流規劃
為了實現校內各業務系統間的數據共享和保證數據的一致性,必須規劃好數據流向。數據共享的總體包括了代碼集的共享和數據集的共享。在這里,“代碼集”主要是指在各個應用系統需要實現流轉的學校標準代碼,“數據集”主要是指在各個業務系統間需要進行數據共享的數據集。
每一個共享的代碼集或數據集都有唯一的權威數據源,執行“誰產生,誰維護”的原則。在整個數據流轉設計中,數據流都不做交叉設計,這樣不會導致數據流混亂,形成誤解。 因些必須對各業務系統進行統一編碼,設置好業務系統間數據共享流程,并對共享數據信息流細化。
2.1業務系統統一編碼
根據我校所使用的各業務系統,分別采用數字對應各業務系統,“41”代表“人事系統”;“42”代表“學工系統”;“43”代表“招生系統”;“44”代表“科研系統”;“45”代表“科研系統”;“47”代表“迎新系統”;“48”代表“離校系統”;“50”代表“校友系統”;“52”代表“辦公系統”;“61”代表“財務系統”;“62”代表“圖書館系統”;“63”代表“一卡通系統”;
2.2業務系統間數據共享流程
業務系統主要涉及到:招生系統、教務系統、迎新系統、學工系統、離校系統、校友系統、人事系統、財務系統、科研系統、辦公系統、圖書館系統、一卡通系統;系統間各業務數據的來源及共享如下圖所示:
每個帶有“數字”箭頭的標記分別表示數據的來源和內容及數據流向哪個業務系統,詳細信息如下:
(1) 新生數據
(2) 新生數據(教務系統已經進行分班編學號處理)
(3) 迎新結果數據
(4) 學生基本信息,學籍基本信息,成績數據
(5) 學生基本信息,學生收費明細
(6) 學生收費結果數據
(7) 獎學金信息,資助信息,貸款信息,綠色通道信息,困難生補助信息
(8) 學生獎學金發放結果,資助金額發放結果,補助發放結果,貸款處理結果
(9) 學生收費數據,學生欠費數據
(10) 需要辦理離校手續的學生信息
(11) 離校后的學生信息
(12) 教職工基本信息,教職工工資明細
(13) 教職工基本信息
(14) 科研成果數據,論文、著作數據
(15) 科研項目信息
(16) 項目經費到賬信息
-教職工信息
(17) -(20)教職工信息
(21) 教師課程安排信息,教學質量評價信息
(22)(23)學生基本信息
3.數據抽取與訂閱
3.1數據抽取與訂閱的實現流程圖
通過觸發器、系統日志、數據變化標志位來捕捉業務系統需要共享或要交換到數據中心的數據發生變化,同步到中介庫,設置中介庫在業務系統數據庫服務器,這樣數據發生變化后同步到中介庫,不需要進行數據庫異構轉換,而且不需要經過任何網絡,這樣能保證數據的實施、高效、安全的數據同步。
3.2數據抽取與訂閱實現
數據中心從各業務系統中抽取需要共享的數據來保持數據同步,如需要從教務系統中取學生信息集和教學場地信息集,需要從人事系統中取教職工信息集。數據中心從業務系統整合數據的關系圖如下:
先由數據中心系統管理員或各業務系統管理員進行數據抽取配置,選擇從哪個系統抽取數據,再設定業務系統信息字段與數據中心信息字段的對應關系如圖3所示:
4.結語
高校信息化建設是一個不斷發展的過程 ,在這個過程中,信息資源的有效整合是一個必然的過程 ,通過整合可以實現現有業務系統之間的數據交換與共享。本文通過分析學校各業務系統的數據特點,規劃出各業務系統的數據流向,并通過數據的抽取與訂閱實現數據共享。
參考文獻:
[1]金保華, 和振遠, 張亮, 李金旭, 趙麗輝 基于 SOA的數據共享與交換平臺分析與設計 鄭 州 輕 工 業 學 院 學 報 (自 然 科 學 版 )2011年2月
[2]李學儉 數據共享環境下統一信息標準的建設與應用 計 算 機 技 術 與 發 展2011年5月
【基于數據抽取與訂閱實現數據共享分析及研究論文】相關文章:
大數據時代基于云計算的數據監護研究論文11-01
大數據自動分析與數據挖掘探討的論文04-26
論文:大數據分析與應用問題研究07-02
大數據環境下的數據安全研究論文10-30
基于大數據的統計分析模型設計論文11-17
簡析基于大數據平臺的動態票額智能預分系統的研究與實現論文10-30
基于現象學方法的大數據實驗室研究分析論文11-02