所屬欄目:電子技術論文 發布日期:2018-03-05 11:02 熱度:
數據挖掘是從海量數據中提取隱含在其中的有用信息和知識的過程,政法工作中的數據挖掘技術不同于其他行業,本文對政府數據挖掘技術進行分析與研究。
《電子技術》是由上海市科學協會主管,上海市電子學會和上海市通信學會主辦的技術性月刊,1963年創刊,是中國最早的電子類期刊之一,也是目前國內最具權威性、發行量最大的電子技術月刊。
一 數據挖掘技術
1 定義
簡單的說, 數據挖掘就是從現有的大量數據中進行分析, 從而對未來的發展做出輔助分析。從更廣義的角度來講, 數據挖掘就是在一些事實或觀察數據的集合中尋找模式的決策支持過程。 因此, 挖掘的對象不僅是數據庫, 還可以是任何組織在一起的數據集合。數據挖掘最初針對的是大型數據庫, 而電子政務中的數據挖掘技術是基于網絡的, 即所謂的網絡數據挖掘, 它除了處理傳統數據庫中的數值型的結構化數據外, 處理更多的是文本、 圖形、 圖像、 WWW 信息資源等半結構、 非結構的數據。數據挖掘在解決實際問題時, 經常要同時使用多種模式。一個數據系統或僅僅一個數據挖掘查詢就可能生成成千上萬的模式, 但是并非所有的模式都令人感興趣。 因此, 興趣度通常被用來衡量模式的總體價值, 它包括正確性、 新奇性、 可用性和簡潔性。
2 功能特性
1) 、 自動預測趨勢和行為: 由歷史的和當前的數據去推測未來的數據。最典型的利用數據挖掘進行預測的例子就是目標營銷。數據挖掘工具可以根據過去郵件推銷中的大量數據找出其中最有可能對將來的郵件推銷做出反應的客戶。
2) 、 關聯分析: 它反映了一個事件和其他事件之間依賴或關聯的知識。如果兩項或多項屬性之間存在關聯, 那么其中一項的屬性值就可以依據其他屬性值進行預測。 舉個例子: 如果在購買面包和黃油的顧客中, 有很多人同時也購買了牛奶, 這樣可以將面包、黃油和牛奶這些顧客經常購買的商品放在一起, 這樣就提高了經濟效益。
3) 、 聚類: 如同通常所說的 “物以類聚” , 是把一組個體按照相似性歸成若干類別。 通過聚類, 數據庫中的記錄可被劃分為一系列有意義的子集。聚類技術主要包括傳統的模式識別和數學分類學。
4) 、 偏差檢測: 偏差包括很多潛在的知識, 如分類中的反常實例、 不滿足規則的特例、觀測結果與模型預測值的偏差、 量值隨時間的變化等。 偏差檢測的基本方法是尋找觀測結果與參照值之間有意義的差別。
3 步驟首先, 熟悉背景知識, 弄清客戶的需求。 其次, 要進行數據挖掘必須收集要挖掘的數據資源。把要挖掘的數據都收集到一個數據庫中, 而不是采用原有的數據庫或數據倉庫。 再次, 對挖掘的數據進行分析, 進行深入調查, 從數據集中找出規律和趨勢, 用聚類分析區分類別, 搞清楚多因素相互影響的、 十分復雜的關系, 發現因素之間的相關性。 在分析好數據集的基礎上, 就可以建立形成知識的模型, 這是進行數據挖掘最重要的核心環節, 一般運用神經網絡、 決策樹、 數理統計、 時間序列分析等方法來建立模型。 最后, 我們要對得到的模型進行評價, 確定哪些是有效的、 有用的模式。 評價的方法一般有三個: 一種辦法是直接使用原先建立的挖掘數據庫中的數據進行檢驗, 另一種辦法是另找一批數據并對其進行檢驗, 再一種辦法是在實際運行的環境中取出新鮮的數據進行檢測。
4. 網絡數據挖掘形式多樣根據不同的網絡數據挖掘對象, 人們將網絡數據挖掘分為網絡內容挖掘(Web content mining)、 網絡結構挖掘(Web structure mining)以及網絡用法挖掘(Web usage mining)。 ( 1) 網絡內容挖掘 網絡信息內容是由文本、 圖像、 音頻、 視頻、 元數據等形式的數據組成的。網絡內容挖掘就是一個從網絡信息內容中發現有用信息的過程。由于網絡信息內容有很多是多媒體數據, 因此網絡內容挖掘也將是一種多媒體數據挖掘形式。 ( 2) 網絡結構挖掘 網絡結構挖掘就是挖掘 Web 潛在的鏈接結構模式。通過分析一個網頁鏈接和被鏈接數量以及對象來建立 Web 自身的鏈接結構模式。這種模式可以用于網頁歸類, 并且由此可以獲得有關不同網頁間相似度及關聯度的信息。網絡結構挖掘有助于用戶找到相關主題的權威站點。 ( 3) 網絡用法挖掘 網絡內容挖掘和網絡結構挖掘的挖掘對象是網上的原始數據, 而網絡用法挖掘面對的則是在用戶和網絡交互的過程中抽取出來的第二手數據, 包括網絡服務器訪問記錄、 代理服務器日志記錄、 瀏覽器日志記錄、 用戶簡介、 注冊信息、 用戶對話或交易信息、 用戶提問方式等。 通過網絡用法挖掘, 可以了解用戶的網絡行為數據所具有的意義。
二. 什么是電子政務隨著網絡時代的到來, 在世界各國積極倡導實施的信息高速公路建設的五大應用領域中, 電子政務被列居首位。電子政務是指國家各級政府部門綜合運用現代網絡通訊與數字化信息技術, 利用國際互聯網及內部局域網完成日常政務工作。其中包括數據的傳遞、 公文的上傳下達等, 從而轉變傳統的工作模式, 實現政府職能部門工作的辦公信息化、 政務公開化、 管理一體化及決策科學化。電子政務是借助電子信息技術而進行的政務活動。由于電子政務是電子信息技術與政務活動的交集, 所以它的內涵和外延在很大程度上取決于我們對于電子信息技術和政務活動所下的定義。電子政務主要包括三個組成部分: 一是政府部門內部的電子化和網絡化辦公; 二是政府部門之間通過計算機網絡而進行的信息共享和實時通信; 三是政府部門通過網絡與民眾之間進行的雙向信息交流。
三. 電子政務離不開數據挖掘由于政府的重要職能之一是對國民經濟和社會發展進行宏觀管與調控, 數據類信息的應用在各級政府的日常工作中占有重要地位, 這就要求各級政府應當及時準確地掌握國民經濟和社會發展的各類數據。有資料表明: 在我國, 各級各類政府部門掌握著全社會的信息資源, 政府是社會信息資源的最大擁有者和應用者, 如何讓這些信息資源高效服務于各級政府機構、 服務于民成為電子政務工程建設中的一項重要的內容。政府信息化是社會信息化的基礎, 只有政府實現了信息化, 才能真正實現社會公共資源的共享, 提高社會資源的運作效率, 促進整個社會融入信息時代。目前, 電子政務系統的構建, 正經歷著由以技術為中心向以數據為中心的方向轉變, 沒有數據信息, 就沒有政府網站及電子政府。因而, 整合政務信息資源, 建設和改造政府系統對內及對外的電子信息資源庫, 解決好各類數據的傳遞、 應用等問題, 勢必成為今后電子政務建設的關鍵所在。電子政務包括政府的信息服務、電子貿易、電子化政府、政府部門重構、 群眾參與政府五個方面的內容。 將網絡數據挖掘技術引入電子政務中, 可以大大提高政府信息化水平, 促進整個社會的信息化。數據挖掘在電子政務中主要用來為政府重大政策出臺提供決策支持。如通過對網絡各種經濟資源的挖掘, 確定未來經濟的走勢, 從而制定出相應的宏觀經濟調控政策。
具體體現在以下幾個方面: ( 1) 政府的電子貿易在服務器以及瀏覽器端日志記錄的數據中隱藏著模式信息, 運用網絡用法挖掘技術可以自動發現系統的訪問模式和用戶的行為模式, 從而進行預測分析。 例如, 通過評價用戶對某一信息資源瀏覽所花費的時間, 可以判斷出用戶對何種資源感興趣; 對日志文件所收集到的域名數據, 根據國家或類型進行分類分析; 應用聚類分析來識別用戶的訪問動機和訪問趨勢等。這項技術已經有效地運用在政府電子貿易中。 ( 2) 網站設計通過對網站內容的挖掘, 主要是對文本內容的挖掘, 可以有效地組織網站信息, 如采用自動歸類技術實現網站信息的層次性組織; 同時可以結合對用戶訪問日志記錄信息的挖掘, 把握用戶的興趣, 從而有助于開展網站信息推送服務以及個人信息的定制服務, 吸引更多的用戶。( 3) 搜索引擎網絡數據挖掘是目前網絡信息檢索發展的一個關鍵。如通過對網頁內容挖掘, 可以實現對網頁的聚類、 分類, 實現網絡信息的分類瀏覽與檢索; 同時, 通過對用戶所使用的提問式的歷史記錄的分析, 可以有效地進行提問擴展, 提高用戶的檢索效果; 另外, 運用網絡內容挖掘技術改進關鍵詞加權算法, 提高網絡信息的標引準確度, 從而改善檢索效果。 ( 4) 決策支持為政府重大政策出臺提供決策支持。 如, 通過對網絡各種經濟資源的挖掘, 確定未來經濟的走勢, 從而制定出相應的宏觀經濟調控政策。從世界范圍來看, 電子政務并未真正得以實現。英國雖然在這一方面全球領先, 但也僅有 60%的政府機構的互連網服務網站已開通或正在建設。隨著電子政務和網絡用戶對高品質、個性化的信息需求的不斷擴大, 將對網絡數據挖掘技術提出更高的要求, 推動這一技術不斷地發展與完善, 更好地為電子政務服務, 從而提高全球的信息化水平。總而言之, 從整個世界范圍來看, 電子政務還沒有真正的實現。各國政務信息化的進度不一、 規模不同。 隨著電子政務系統和民眾對高品質、個性化信息需求的不斷擴大, 以及網絡相關技術的不斷更新, 會對電子政務系統的建設提出更高更具體的要求, 這也將推動電子政務系統不斷地完善, 更好地向著政務智能化的方向。
文章標題:政府電子政務中的數據挖掘技術
轉載請注明來自:http://www.56st48f.cn/fblw/dianxin/dianzijishu/38016.html
攝影藝術領域AHCI期刊推薦《Phot...關注:105
Nature旗下多學科子刊Nature Com...關注:152
中小學教師值得了解,這些教育學...關注:47
2025年寫管理學論文可以用的19個...關注:192
測繪領域科技核心期刊選擇 輕松拿...關注:64
及時開論文檢索證明很重要關注:52
中國水產科學期刊是核心期刊嗎關注:54
國際出書需要了解的問題解答關注:58
合著出書能否評職稱?關注:48
電信學有哪些可投稿的SCI期刊,值...關注:66
通信工程行業論文選題關注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關注:120
評職稱發論文好還是出書好關注:68
復印報刊資料重要轉載來源期刊(...關注:51
英文期刊審稿常見的論文狀態及其...關注:69
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3