淺談數據挖掘技術及其在高等學校教學中的應用教育論文
關鍵詞:數據挖掘 高校教學 教育信息化
摘要:數據挖掘技術目前在商業、金融業等方面都得到了廣泛的應用,而在教育領域應用較少。本文通過時數據挖掘在高校教學中的應用分析,認為數據挖掘技術可以幫助教學人員合理安排教學工作,協助輔導員對學生的管理,對提高學校的教學管理水平起到指導作用 。
1引言
隨著12世紀信息化時代的到來,整個社會的信息總量呈幾何級數迅速增長,人們利用信息技術生產和搜集數據的能力大幅度提高,積累的數據越來越多,但缺乏挖掘數據中隱藏知識的手段,導致了“數據爆炸但知識貧乏”的現象。隨著數據庫技術的成熟和數據應用的普及,在過去的若干年中,人們積累了大量的數據資料,但數據庫中隱藏豐富的知識及有價值信息遠遠沒有得到充分地發掘和利用,隨著數據量以指數速度激增,人們渴求從數據汪洋中出現一個去粗存精、去偽存真的技術,越來越希望系統能夠提供更高層次的數據分析功能,從中找出規律和模式,幫助決策者發現數據間重要但被忽略的因素,從而更好地支持決策或科研工作。正是為了滿足這種要求,從數據庫中發現知識(KDD)及其核心技術—數據挖掘技術應運而生。
2數據挖掘介紹
2.1概念及其特點
數據挖掘(DtaaMniing)是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的,人們事先不知道的但又潛在有用的信息和知識的過程,提取的知識表示為概念、規則、模式等。根據數據挖掘的目標,采用人工智能、集合論、統計學等方法,應用相應的數據挖掘算法,分析數據并通過可視化工具表述所獲得的模式或規則。
數據挖掘有以下特點:(1)能發現反映系統局部特征和規律的模型;(2)自動趨勢預測,能發現“新”的知識;(3)比較容易獲得很多規則,并能及時更新。數據挖掘方法具有開放性思維方法,它可以及時借鑒和引用模型法的很多成果,比如神經網絡、粗糙集、樸素貝葉斯算法等方法都已被利用在數據挖掘方法中。
2.2數據挖掘目的及其過程
2.2.1目的
數據挖掘期望發現的知識有如下幾類:(1)反映同類事物共同性質的泛化知識;(2)反映一事物和其他事物之間依賴或關聯的關聯型知識;(3)分類、聚類知識,是反映同類事物共同性質的特征型知識和不同事物之間的差異型知識;(4)根據歷史和當前的數據推測未來的預測型知識。
2.2.2挖掘的過程
挖掘過程是從大型庫中挖掘未知的、有效的、可實用的信息,并使用這些信息做出決策。通常可以分為準備、數據挖掘、評價階段以及運用階段等四個階段。
(1)數據準備階段。數據準備階段是消除數據噪聲和與挖掘主題明顯無關的數據,完成對數據的篩選、變換和預處理。經處理過的數據一般存儲在數據倉庫中。數據準備是否做得充分將影響到數據挖掘的效率和準確度以及最終模式的有效性。包括:①數據的選擇:選擇相關的數據;②數據的預處理:消除噪音、冗余數據;③數據的推測:推算缺失數據;④數據的轉化:離散值數據與連續值數據之間的相互轉換、數據值的分組分類、數據項之間的計算組合等;⑤數據的縮減:減少數據量。
(2)挖掘階段。該階段是數據挖掘的核心步驟,也是技術難點所在。根據數據挖掘的目標,采用人工智能、集合論、統計學等方法,應用相應的數據挖掘算法,分析數據并通過可視化工具表述所獲得的模式或規則。
(3)評價階段。在數據挖掘中得到的模式可能是沒有實際意義或沒有使用價值的,也有可能不能準確反映數據的真實意義,因此需要評估,確定有效的、有用的模式。評估可以根據用戶多年的經驗,有些模式也可以直接用數據來檢驗其準確性。如何將挖掘出的有用知識清楚易懂地提供給教育和管理工作者也是一項非常重要的工作,選擇合適的可視化工具,將結果以關系表或用量化特征規則表示給用戶。
(4)運用階段。用戶理解的、并被認為是符合實際和有價值的模式形成了知識。同時還要對知識進行一致性檢查,解決與以前得到的知識互相沖突、矛盾的地方,使知識得到鞏固。運用知識有兩種方法:一種是只需看知識本身所描述的關系或結果,就可以對決策提供支持;另一種是要求運用知識對新的數據進行分析,由此可能產生新的問題,而需要對知識作進一步的優化。
2.2.3數據挖掘的方法
在數據挖掘算法的理論基礎上,數據挖掘中的常用方法有:①生物學方法,包括人工神經網絡、遺傳算法等;②信息論方法包括決策樹等;③集合論方法包括約略集、模糊集、最鄰近技術等;④統計學方法;⑤可視化技術等方法。數據挖掘的各類算法包括預測模型、關聯規則挖掘算法、分類規則挖掘算法、序列模式分析算法、聚類分析算法、WEB數據挖掘等。
3數據挖掘在高等學校教學中的應用
3.1學生的基本信息
利用數據挖掘技術,比如可以對學生訪問情況進行分析,跟蹤、了解學生出勤情況。還可對學生年齡等個人情況進行分析,了解學生的組成、結構,為合理地安排課程設置提供依據。通過對學生考試情況的分析,并結合出勤情況,可作為考查學生學習的情況,為合理地評估學生綜合素質提供依。對于挖掘出來的規則信息可以利用可視化技術,以圖表或曲線等形式提供給教師,以使教師能充分利用學生的問題資源,從而提高教學質量。另外,數據挖掘可以應用于網上的考試系統,對考生情況和他取得的成績進行挖掘,以幫助教師在以后的教學中更好地讓學生掌握知識。
3.2學生的學習特征
學生特征包括兩個方面:一是學習準備,一是學習風格。學習準備包括初始能力和一般特征兩個方面。學生的初始能力是指學生在學習某一特定的課程內容時,已經具備的有關知識與技能的基礎,以及他們對這些學習內容的認識和態度。學生的一般特征則是指在學習過程中影響學生的心理、生理和社會的`特點,包括年齡、性別、年級、認知成熟度、智力才能、學習動機、個人對學習的期望、生活經驗、文化、社會、經濟等背景因素。學生的學習風格與學習活動有著密切的關系。對學生感知不同事物、并對不同事物做出反應這兩方面產生影響的所有心理特征構成了學習風格。
利用數據挖掘功能分析學生特征,并在此基礎上組織學習內容、闡明學習目標、確定教學策略、選擇教學媒體,為學生創造出一個適合其內部條件的外部學習環境,使有效學習發生在每個學生的身上。
3.3預測學生和教師行為發生
管理信息系統中記錄著有關學生與教師在教學中發生的各種教學事故以及典型教學事例等教學運行信息,利用數據挖掘的關聯分析與演變分析等功能,尋找師生各種行為活動之間的內在聯系。如“當存在A,B時可以推出’C,這樣的規則,即當有A行為和B行為發生時,還會有C行為。在教學過程中,如果發現學生或教師已有A,B行為時,馬上可以分析其產生C行為的可能性,及時制定策略促進或制止C行為的發生。
3.4合理設置課程
在學校,學生的課程學習是循序漸進的,而且課程之間有一定的關聯與前后順序關系。在學一門較高級課程之前必須先修一些先行課程,如果先行課程沒有學好,勢必會影響后續課程的學習。另外,同一年級學習同一課程的不同班級,由于授課教師、班級文化的不同,班內學生的總體成績相差有時會很大。利用學校教學數據庫中存放的歷屆學生各門學科的考試成績,結合數據挖掘的關聯分析與時間序列分析等相關功能,就能從這些海量數據中挖掘出有用的信息,幫助分析這些數據之間的相關性、回歸性等性質,得出一些具有價值的規則和信息,最終找到影響學生成績的原因。在此基礎上,對課程設置做出合理安排。
3.5評價學生學習情況
學習評價是教育工作者的重要職責之一。評定學生的學習行為,既對學生起到信息反饋和激發學習動機的作用,又是檢查課程計劃、教學程序以至教學目的的手段,也是考查學生個別差異,便于因材施教的途徑。
特別是對成績管理數據庫進行挖掘,其數據來源于成績管理數據庫,挖掘的任務就是從用戶指定的數據庫中以不同的角度或不同的層次上采掘出一系列的統計結果,如分布情況、關系,對比、顯著性檢驗等,采掘結果用交叉表,特征規則,關聯規則,統計的曲線、圖表等表示,所以采用統計分析方法具有簡單、方便、直觀等優點,最為合適。
因此對學生學習行為和綜合素質進行評價,一般采用模糊論中的模糊綜合評判及模糊聚類的方法,對評價結果采用了對定性和定量指標加權平均算出綜合素質評價得分并排名的方法,而且由于學生綜合素質的評價指標是動態變化的,往往選用動態聚類法對評判結果進行動態聚類分析。
3.6評價教學質里
教學評價是根據教育目標的要求,按一定的規則對教學效果做出描述和確定,是教學各環節中必不可少的一環。教學評價可以通過校園網收集學生對任課教師所講授、輔導課程的意見、評價。有關學生座談意見、學生打分評價、平時各項教學檢查、相應課程期末考試班級成績匯總等都是教學評價的內容,把這些數據要作為教師教授相應課程的檔案數據全部存人數據庫。
利用數據挖掘對數據庫中有關教學的各項評價進行分析處理,可以確定教師的教學內容的范圍和深度是否合適;選擇的教學媒體是否適合所選的教學內容和教學對象;講解的時間是否恰到好處;教學策略是否得當等。從而可以及時的將挖掘出的規則信息反饋給教師,以期更好地提高其教學水平,更好地服務于學生。
4結束語
總之,隨著信息量的急劇增長和對信息提取的更高要求,現在我們很難再依照傳統方法在海量數據中尋找決策的依據,這就必須借助數據挖掘去發掘數據中隱藏的規律或模式,為決策提供更有效的支持。雖然數據挖掘作為一種工具,它永遠也不能替代教師的地位,但是它可以為教師的決策提供科學的依據。數據挖掘技術本身就是人們大量實踐的結晶,它為建立傳統教學中很難獲取或不可能獲取的模型提供了捷徑。
【淺談數據挖掘技術及其在高等學校教學中的應用教育論文】相關文章:
科研管理中數據挖掘技術的應用論文10-21
數據挖掘在CRM中的應用論文04-10
網絡營銷中數據挖掘技術的應用論文07-07
高校管理中數據挖掘技術的應用途徑論文10-28
數據挖掘在培訓管理中的應用論文12-19
分析在課程教學中數據挖掘技術的選擇論文10-15
數據挖掘技術在科技期刊網站中的應用論文11-04
高校管理中數據挖掘技術的研究論文01-15