電子政務平台的數據挖掘探索
互聯管理
作者:熊燕
摘 要 電子政務平台旨在服務於社會公共事業,本文討論了政務處理方法的曆程,重點突出了新信息技術(數據挖掘技術)對政務的革新作用。最後以檢察院為例提出具體應用數據倉庫和數據挖掘技術的有效方法,輔助政府獲得潛在的知識信息。
關鍵詞 電子政務 數據倉庫 數據挖掘
中圖分類號:C931 文獻標識碼:A
在信息時代,信息技術的快速發展對社會各個領域都產生了一定的影響,在電子商務中反映尤為突出。電子政務的出現相對較晚,但據國外學者研究表明大約80%以上的重要信息資源掌握在政府手中,所以許多國家都將電子政務作為本國在信息技術應用領域的首要任務。
1政務數據處理狀態分析
政府不僅是處理人民群眾日常事務的單位,它更重要的作用體現在可以反映群眾的多數意見和分析社會大範圍的特征,並以此幫助人民群眾和社會向更好的方向發展。政府對這些事務的處理到目前為止經曆了人工和計算機處理的兩大階段。
(1)人工處理階段
為了反映較大範圍人民群眾的整體特征,政府經常要付出龐大的人力和物力收集大量數據。這個數據的收集通常要經曆一個較長的時間,間隔一段時間還必須重複執行。比如犯罪規律調查、經濟普查、群眾意向調查等。然而,分析收集來的海量數據更是政府頭疼的一件事。比如經濟普查,政府需知道近10年、近20年、50年甚至更長時間的經濟發展狀況,那光靠人工去翻閱以前的數據就是件很困難的工作了。所以人工處理數據階段,有許多政務受到很大的限製。
(2)計算機處理階段
隨著計算機在各政府部分的使用,逐漸出現了“電子政務(Electronic Government,即EG)”。目前為止,電子政務的發展大致經曆了以下三個階段:麵向數據處理的第一代電子政務、麵向信息處理的第二代電子政務、麵向知識處理的第三代電子政務。在前兩個階段中,許多政務工作確實提高了效率,但是政府海量數據中隱含的價值仍不能被有效發掘。正如在一大座金山中,獲取更有價值的黃金還需更細致更有效的清理和挖掘。由於信息技術的發展,電子政務逐漸進入第三代發展中,即有效應用數據倉庫和數據挖掘技術挖掘知識。
2 DW和DM技術
數據倉庫(DataWare,即DW)是指一個麵向主題的、集成的、非易失的且隨時間變化的數據集合,用來支持管理人員的決策。麵向知識處理的EG係統應能夠自動剔除掉不需要的數據,按照用戶的要求整合雜亂的數據資源,獲取某些可用的屬性。
數據挖掘(Data Mining,即DM)是指從大量的數據中,抽取出潛在的、有價值的知識(模型或規則)的過程。數據挖掘就是從大量數據中提取或“挖掘”知識。
首先,我們要確定數據挖掘的對象有哪些。其次,要有效地應用數據挖掘技術,就要遵循科學的應用流程。一般的挖掘流程是:(1)確定挖掘對象;(2)數據準備;(3)數據挖掘,即模式提取;(4)結果分析,即模式評估。
3政務平台的數據挖掘過程
按照上述數據挖掘的基本流程,以檢察院為例介紹如何在EG係統真正實現數據挖掘。
3.1構建EG係統的數據倉庫
這部分主要分為以下四個任務:
(1)確定檢察院EG係統中的數據源
檢察院EG係統的數據主要從兩個方麵獲得:第一個是調研和用戶主動提供的數據資源;第二個是EG係統從其門戶網站中獲得數據源。
>>章節報錯<<