所屬欄目:計算機信息管理論文 發布日期:2014-08-26 15:14 熱度:
隨著廣東水利信息化事業的快速發展,先后啟動了省三防指揮系統等骨干項目和實際應用,內涵涵蓋多個職能部門和專業領域,并形成了海量水利數據信息,由于缺乏有效的整合利用手段和共享平臺,許多業務應用系統開發附帶的具有公共價值的數據資源處于獨立專用狀態,形成“信息孤島”。
【摘 要】通過總結目前數據架構和組織形式,分析廣東省水利數據中心數據存儲架構、數據存儲及交換方式以及數據服務設計,構建共享、高效的水利數據中心數據存儲架構體系,為同類數據工程建設提供有益的參考。
【關鍵詞】學術論文發表,數據中心,數據存儲,元數據
【Abstract】Summarizing the current data structure and organization, it is analyzed about the data storage architecture, the way of data exchanging and data service designing, and then the efficient storage architecture system is constructed about data center ,and it provides reference for similar engineering construction.
【Key words】Data center;Data storage;Metadata
0 前言
廣東省水利數據中心是一項大型信息系統工程,通過建立完善的水利數據庫,有效匯聚全省水雨情信息,并按照一數一源的原則,優化數據庫表結構,解決數據資源整合及共享問題,更好的為廣東水利事業提供信息共享交換服務。
1 數據存儲設計
數據中心的數據架構圖如圖所示,主要由ODS區、數據倉庫區、數據緩沖區(交換數據臨時存儲區)、非結構化數據存儲區、元數據及資源信息目錄等區域構成,并通過數據對上接口區與水利部進行數據交換,通過數據對下接口區實現與各地市及流域局的數據交換。
1.1 ODS區
ODS區即操作型數據存儲區(Operational Data Store,ODS),存放集成的、可更新的、近實時的業務數據,用于業務系統與數據倉庫之間的數據遷移,支持基于主題域的實時查詢,省數據中心的ODS區主要存放25類數據庫以及水利普查數據庫。
為最大程度地集成既有業務系統完整的數據信息源,降低對業務系統的影響,ODS區還辟有業務數據暫存區,主要存放既有業務系統數據庫的全量備份,并以此作為25類數據庫的數據來源。
1.2 數據倉庫區
數據倉庫(Data Warehouse,DW)存放面向主題的、集成的、相對穩定的、反映歷史變化的數據。數據倉庫統一存放與管理經整合后、具有分析價值的歷史數據與現狀數據,支持基于大量歷史數據的企業決策分析。數據倉庫區分兩個層次,第一層次為Master庫,該庫中的數據是面向主題存放的基礎明細數據,可用于決策支持。第二層次為Master庫的子集,包含數據集市、數據挖掘庫和共享信息庫,數據集市面向特定的分析應用,數據挖掘庫提供深層次的數據挖掘服務,共享信息庫是根據特定需求從Master庫抽取的可共享的數據庫。
1.3 元數據及資源信息目錄存儲區
本項目中,元數據用于存放ODS和DW中基礎庫、專題庫、Master庫中數據的機構信息,資源目錄用于存放數據資源信息,通過資源目錄體系建設,形成全省水利行業統一管理和服務的資源目錄體系。
2 數據庫設計
2.1 數據庫架構
廣東省水利數據中心數據架構ODS存儲區中,ODS存儲區如圖2所示,主要包含基礎數據庫、專業數據庫、數據暫存區數據庫和水利普查數據庫,數據倉庫中主要包含Master數據庫、主題數據庫、數據挖掘庫和共享信息庫,其中Master數據庫對用戶屏蔽,數據倉庫通過主題數據庫對外提供服務。主題數據庫主要為基于數據中心的輔助決策類業務應用提供服務,由業務部門提出服務需求,數據中心根據需求信息生成業務模型,形成對應于業務需求的數據信息。主題數據庫提供的服務基于OLAP業務應用,以海量數據為基礎,能對數據進行匯總,建立多維度分析、查詢和報表,側重于決策支持。
2.2 數據整合設計
數據整合主要包括橫向數據整合和縱向數據整合兩個部分,橫向數據整合主要針對省廳各業務處室的現有業務系統數據整合,該部分業務系統通過全量復制數據在 ODS層落地,與標準數據庫建立映射關系,對數據進行標準化轉換后存入標準化數據庫中。其中ODS區的數據需要經過清洗、轉換后按照相應規則抽取到 Master庫中,再經過二次ETL得到面向應用主題的主題數據庫以提供輔助決策功能?v向數據整合主要指地市系統與省系統、國家系統與省系統的數據交換,地市水利數據通過數據交換服務將數據發送到數據倉庫的臨時存儲區,然后再經過ETL方式將數據載入數據中心ODS層對應數據庫。省級系統與國家系統的數據交換同樣通過數據交換平臺按照水利部提供的業務數據需求實現數據上報。
3 元數據
元數據被稱為“關于數據的數據”目的是使數據能夠被正確理解和解釋。廣東省水利數據中心覆蓋到端到端的元數據體系如圖3所示。
數據中心元數據分布圖
元數據主要分布在以下幾個環節:
數據建模工具的元數據:其數據項包含以下對象(包括但不限于):Model,ValidationRule,DefaultValue,Transform,Table,Column,Key(primaryKey,forei- gnKey,NonUniqueKey),Relationship。 數據庫(ODS&DW)元數據:用來存儲數據倉庫的數據實體信息,該部分包含的元數據項至少有以下對象(包括但不限于):Catalog,Schema,Table,View,Column,Procedure,SQLIndex,Trigger,CheckConstraint。
ETL工具元數據:該工具的核心作用是對數據的處理,包括數據抽取、轉換、清洗、裝載的過程。ETL工具的元數據體現為一些數據流圖,其描述數據處理過程(Transformation),分析數據的來源及輸出等。ETL元數據包含以下對象(包括但不限于):repository;task(包括的類型有 Workflow,Session,Command,Email,Worklet,Decision,Event ait,Event Raise,Timer,Assignment,Control);Task(Mapping里的 Sources,TargetTransformations) 等。
OLAP工具元數據:OLAP展現在用戶面前是一幅幅多維視圖。其元數據主要包括維的層次、維的成員、度量的信息等。
BI前端工具元數據:BI工具屬于業務層面的工具,其主要包含的元數據是對統計分析指標的業務定義、統計口徑定義等。
4 數據服務設計
數據中心ODS區各類數據庫資源以及數據倉庫中Master庫對用戶屏蔽,用戶通過共享信息庫和主題數據庫訪問數據中心的數據資源。
共享信息庫是指通過將實體數據根據業務需要抽象出來可供多個業務應用訪問的可共享信息倉庫,用戶并不能直接訪問Master數據庫中的數據資源,在一定程度上保證了數據安全,又可以保證業務系統的基本穩定。
主題數據庫為基于數據中心的輔助決策類業務應用提供服務,由業務應用向數據中心提出申請,數據中心根據申請主題形成業務模型,生成對應于業務的事實表和應用與模型的維信息,主題數據庫的數據主要通過ETL工具生成。
事實表(Fact Table),數據倉庫架構中的中央表,是存儲可度量的值的詳細數值或實際數值的關系數據庫中的表格,包含聯系事實與維表的數字度量值和鍵。
維表(Dimension Table),數據倉庫中的表,其條目描述事實數據表中的數據,維表包含創建維度所需的數據。
5 結語
廣東省水利數據中心是全國首個省級水利數據中心,通過對數據中心數據架構的分析和研究,總結數據架構設計和匯交方式,通過存儲分區結構,實現數據的快速查詢、數據挖掘和信息共享,通過數據整合設計實現數據的橫向整合和縱向整合,為主題數據庫提供輔助決策,并實現地市和省級節點向國家節點的數據上報,通過數據庫及數據服務設計,定義數據庫結構和元數據體系,確定數據中心對外提供服務的方式。目前對水利數據中心的研究還存在很多難點,下一步要解決的問題是如何利用數據中心中的大量數據為為預測洪澇災害提供決策支持,希望通過本次研究能對廣大同行有所幫助。
【參考文獻】
[1]劉曉茜.云計算數據中心結構及其調度機制研究[D].合肥:中國科技大學,2011.
[2]鄧維.云計算數據中心的新能源應用:研究現狀與趨勢[J].計算機學報,2013,(3).
[3]鄭華鋒.寧德市水電開發[M].北京:水利水電出版社,2008.
文章標題:學術論文發表廣東省水利數據中心數據架構研究
轉載請注明來自:http://www.56st48f.cn/fblw/dianxin/xinxiguanli/22482.html
攝影藝術領域AHCI期刊推薦《Phot...關注:107
Nature旗下多學科子刊Nature Com...關注:152
中小學教師值得了解,這些教育學...關注:47
2025年寫管理學論文可以用的19個...關注:192
測繪領域科技核心期刊選擇 輕松拿...關注:64
及時開論文檢索證明很重要關注:52
中國水產科學期刊是核心期刊嗎關注:54
國際出書需要了解的問題解答關注:58
合著出書能否評職稱?關注:48
電信學有哪些可投稿的SCI期刊,值...關注:66
通信工程行業論文選題關注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關注:121
評職稱發論文好還是出書好關注:68
復印報刊資料重要轉載來源期刊(...關注:51
英文期刊審稿常見的論文狀態及其...關注:69
電子信息論文范文
智能科學技術論文 廣播電視論文 光電技術論文 計算機信息管理論文 計算機網絡論文 計算機應用論文 通信論文 信息安全論文 微電子應用論文 電子技術論文 生物醫學工程論文 軟件開發論文
SCI期刊分析
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3