近年來(lái),随著(zhe)大(dà)數據成爲互聯網信息技術行業的(de)流行詞彙,教育逐漸被認爲是大(dà)數據可(kě)以大(dà)有作爲的(de)一個(gè)重要應用(yòng)領域,有人(rén)大(dà)膽地預測大(dà)數據将給教育帶來(lái)革命性的(de)變化(huà)。大(dà)數據技術允許中小學和(hé)大(dà)學分(fēn)析從學生的(de)學習(xí)行爲、考試分(fēn)數到職業規劃等所有重要的(de)信息。許多(duō)這(zhè)樣的(de)數據已經被諸如美(měi)國國家教育統計中心之類的(de)政府機構儲存起來(lái)用(yòng)于統計和(hé)分(fēn)析。盤點近年來(lái)大(dà)數據應用(yòng)于教育行業的(de)十大(dà)案例。
國内:
一、華中科技大(dà)學近兩年個(gè)性化(huà)大(dà)數據的(de)實踐,通(tōng)過數據理(lǐ)出學生在校期間生活和(hé)學習(xí)的(de)主線,并放在一個(gè)故事化(huà)的(de)場(chǎng)景裏來(lái)叙述,引起了(le)衆多(duō)畢業生的(de)共鳴。
6月(yuè)8日,一封名叫《光(guāng)陰的(de)故事一緻某某》的(de)電子信件和(hé)截圖在華中科技大(dà)學畢業生的(de)微信朋友圈廣爲流傳。每一位即将離校的(de)學子隻要打開鏈接,輸入自己的(de)校園賬号就能獲取在校期間的(de)學習(xí),讀書(shū),餐飲等各方面數據和(hé)收獲。
該校網絡與信息化(huà)辦公室副主任王士賢介紹,《畢業生大(dà)數據--光(guāng)陰的(de)故事》由華中科技大(dà)學網絡與信息 化(huà)中心在2015年第一次推出,今年在教務類數據的(de)基礎上還(hái)增加了(le)畢業生的(de)借書(shū)、進出圖書(shū)館,黨員(yuán)組織 發展,校園卡刷卡,計算(suàn)機等考等相關數據。
二、由廈大(dà)圖書(shū)館設計的(de)一個(gè)名爲“圕(tuan)·時(shí)光(guāng)”的(de)網站, 收集整理(lǐ)了(le)畢業生大(dà)學時(shí)代的(de)閱讀記錄、進館次數等, 被畢業生視爲大(dà)學生涯的(de)圖書(shū)館記憶。今年,這(zhè)個(gè)網站還(hái)特别增加了(le)畢業生在食堂的(de)消費記錄,如打了(le)多(duō)少份免費米飯。也(yě)就是說,這(zhè)是一份物(wù)質食糧和(hé)精神食糧的(de)雙重記憶。
由于今年的(de)“圕·時(shí)光(guāng)”,新增了(le)學生們在食堂的(de)消費記錄,畢業生登錄後,不僅能看到自己最愛(ài)去的(de)餐 廳、超市、消費的(de)金額,還(hái)能看到自己在大(dà)學期間,打了(le)多(duō)少份米飯。廈大(dà)圖書(shū)館表示,這(zhè)是根據學生一卡通(tōng)的(de)大(dà)數據統計出來(lái)的(de),隻提供給學生本人(rén)。
三、每個(gè)月(yuè)在食堂吃(chī)飯超過60頓、一個(gè)月(yuè)總消費不足420元的(de),被列爲受資助對(duì)象。
據報道,南(nán)京理(lǐ)工大(dà)學教育基金會通(tōng)過數據分(fēn)析,每個(gè)月(yuè)在食堂吃(chī)飯超過60頓、一個(gè)月(yuè)總消費不足420元 的(de),被列爲受資助對(duì)象。南(nán)京理(lǐ)工大(dà)學還(hái)采取直接将補貼款打入學生飯卡的(de)方式,學生無需填表申請,不用(yòng)審核。
四、電子科大(dà)曾做(zuò)過一個(gè)課題——尋找校園中最孤獨的(de)人(rén)。 他(tā)們從3萬名在校生中,采集到了(le)2億多(duō)條行爲數據,
數據來(lái)自學生選課記錄、進出圖書(shū)館、寝室,以及食堂用(yòng)餐、超市購(gòu)物(wù)等數據。通(tōng)過對(duì)不同的(de)校園一卡通(tōng) 前一後刷卡”的(de)記錄進行分(fēn)析,可(kě)以發現一個(gè)學生在學校有多(duō)少親密朋友,比如戀人(rén)、閨蜜。
最後,通(tōng)過這(zhè)個(gè)課題找到了(le)800多(duō)個(gè)校園中最孤獨的(de)人(rén),他(tā)們平均在校兩年半時(shí)間,一個(gè)知心朋友都沒有。 這(zhè)些人(rén)中的(de)17%可(kě)能産生心理(lǐ)疾病,剩下(xià)的(de)則可(kě)能用(yòng)意志力暫時(shí)戰勝了(le)症狀,但需要學校和(hé)家長(cháng)重點予以關愛(ài)。
國外:
五、紐約州波基普西市瑪麗斯特學院(Marist College)與商業數據分(fēn)析公司Pentaho合作發起開源學術分(fēn)析計劃 (The Open Academic Analytics Initiative),旨在一 門新課程開始的(de)兩周内預測哪些學生可(kě)能會無法順利完成課程。
該計劃基于Pentaho的(de)開源商業分(fēn)析平台(Business Analytics Platform)開發了(le)一個(gè)分(fēn)析模型,通(tōng)過收集分(fēn)析學生的(de)學習(xí)習(xí)慣——例如點擊線上閱讀材料、是否在網上論壇中發言、完成作業的(de)時(shí)長(cháng)——來(lái)預測學生的(de)學業情況、及時(shí)幹預幫助問題學生,從而提升畢業率。
六、KickUp是一個(gè)專注教師測評的(de)标準化(huà)SaaS工具,測評數據來(lái)自教師的(de)自查報告及學年内的(de)各項教學結果的(de)反饋,這(zhè)些數據可(kě)以縱向記錄教師的(de)成長(cháng)曆程,提出有待改善的(de)地方。KickUp根據學生和(hé)老師的(de)數量、 按地區(qū)進行收費,目前全美(měi)有超過50個(gè)地區(qū)的(de)學校在使用(yòng)這(zhè)款測評工具。
七、以美(měi)國的(de)著名高(gāo)校卡内基梅隆大(dà)學和(hé)普渡大(dà)學爲例: 對(duì)這(zhè)兩所高(gāo)校,領英都收集了(le)60000多(duō)名畢業生的(de)職業生涯數據。數據量之龐大(dà),足以在其中看出清晰的(de)規律。輸入“MIT”,你很快(kuài)就會看到這(zhè)所高(gāo)校的(de)畢業生一般會在谷歌(gē)、IBM和(hé)甲骨文公司找到工作。輸入“普渡”,你會發現禮菜、康明(míng)斯和(hé)波音(yīn)是畢業生的(de)首選。
這(zhè)類信息對(duì)于中學的(de)高(gāo)年級生和(hé)低年級學生都是一座金礦,因爲大(dà)多(duō)數中學生對(duì)将來(lái)的(de)職業都隻有模糊的(de)想法。運用(yòng)領英的(de)這(zhè)個(gè)工具,對(duì)太陽能、編劇、或者醫療器械感興趣的(de)學生,就可(kě)以挑選那些畢業生最容易進入相關領域的(de)大(dà)學拫考了(le)
八、據PBS報道,伊薩卡學院(Ithaca College)自2007年開始收集學生的(de)社交網絡數據。該學院爲申請者設立了(le)一個(gè)類似Facebook的(de)網站IC PEERS,讓申請者得(de) 以通(tōng)過網站聯系學院教師和(hé)彼此。
伊薩卡使用(yòng)舊(jiù)M統計分(fēn)析系統來(lái)收集IC PEERS上産生的(de)數據,研究擁有怎樣的(de)網絡行爲的(de)學生更有可(kě)能選擇就讀伊薩卡。收集的(de)數據包括申請者上傳了(le)多(duō)少張賬戶照(zhào)片、擁有多(duō)少名IC PEERS好友。研究人(rén)員(yuán)認爲, 這(zhè)能反映出申請者對(duì)這(zhè)所學院有多(duō)感興趣。
九、“希維塔斯學習(xí)”是一家專門聚焦于運用(yòng)預測性分(fēn)析、 機器學習(xí)從而提高(gāo)學生成績的(de)年輕公司。Civitas Learning提供了(le)一套應用(yòng)程序,學生和(hé)老師可(kě)以在其中規劃自己的(de)課程和(hé)安排。“希維塔斯學習(xí)’’各種基于雲的(de)智能手機第三方應用(yòng)程序(APP)都是用(yòng)戶友好型的(de),能夠根據高(gāo)校的(de)需要個(gè)性化(huà)。這(zhè)意味著(zhe)高(gāo)校能聚焦于各自不同的(de)對(duì)象,相互不同地用(yòng)這(zhè)家公司的(de)分(fēn)析工具開展大(dà)數據工作。
該公司在高(gāo)等教育領域建立起最大(dà)的(de)跨校學習(xí)數據庫。 通(tōng)過這(zhè)些海量數據,能夠看到學生的(de)分(fēn)數、出勤率、 辍學率和(hé)保留率的(de)主要趨勢。通(tōng)過使用(yòng)100多(duō)萬名學生的(de)相關記錄和(hé)700萬個(gè)課程記錄,這(zhè)家公司的(de)軟件能夠讓用(yòng)戶探測性地知道導緻辍學和(hé)學習(xí)成績表現不良的(de)警告性信号。此外,還(hái)允許用(yòng)戶發現那些導緻無謂消耗的(de)特定課程,并且看出哪些資源和(hé)幹預是最成功的(de)。
十、一家名爲Knewton的(de)大(dà)數據公司開發了(le)一個(gè)數字平台, 該平台分(fēn)析了(le)幾百萬學生(從幼兒(ér)園到大(dà)學)的(de)學習(xí)過 程,并基于這(zhè)一分(fēn)析來(lái)設計更加合理(lǐ)的(de)測試題目和(hé)更加個(gè)性化(huà)課程目标。該公司與Houghton Mifflin Harcourt建立了(le)合作關系,開發出了(le) K-12階段的(de)個(gè)性化(huà)數學課程,同時(shí)還(hái)與法國創業公司Gutenberg Technology—道,開發了(le)智能數字教科書(shū)。
簡單來(lái)說,這(zhè)些課程和(hé)教科書(shū)能夠适應每個(gè)學生的(de)差異。學生可(kě)以按照(zhào)自己的(de)節奏來(lái)控制學習(xí)進度,而不會受到周圍其他(tā)學生的(de)行爲的(de)影(yǐng)響。然後,系統會給教師一個(gè)反饋,告知哪個(gè)學生在哪個(gè)方面有困難,同時(shí)給出全班學生的(de)表現的(de)整體分(fēn)析數據。
在教育學習(xí)領域,大(dà)數據中提取價值的(de)5種主要的(de)技術如下(xià):
1.預測(Prediction)——覺知預料中的(de)事實的(de)可(kě)能性。例如,要具備知道一個(gè)學生在什(shén)麽情況下(xià)盡管事實上有能力但卻有意回答(dá)錯誤的(de)能力。
2.聚類(Clustering)——發現自然集中起來(lái)的(de)數據點。這(zhè)對(duì)于把有相同學習(xí)興趣的(de)學生分(fēn)在一組很有用(yòng)。
3.相關性挖掘(Relationship Mining)——發現各種變量之間的(de)關系,并對(duì)其進行解碼以便今後使用(yòng)它們。這(zhè)對(duì)探知學生在尋求幫助後是否能夠正确回答(dá)問題的(de)可(kě)靠性很有幫助。
4.升華人(rén)的(de)判斷(Distillation for human judgment)——建立可(kě)視的(de)機器學習(xí)的(de)模式。
5.用(yòng)模式進行發現(Discovery with models)——使用(yòng)通(tōng)過大(dà)數據分(fēn)析開發出的(de)模式進行“元學習(xí)”(meta-study)。一家名爲Knewton的(de)大(dà)數據公司開發了(le)一個(gè)數字平台, 該平台分(fēn)析了(le)幾百萬學生(從幼兒(ér)園到大(dà)學)的(de)學習(xí)過 程,并基于這(zhè)一分(fēn)析來(lái)設計更加合理(lǐ)的(de)測試題目和(hé)更加個(gè)性化(huà)課程目标。該公司與Houghton Mifflin Harcourt建立了(le)合作關系,開發出了(le) K-12階段的(de)個(gè)性化(huà)數學課程,同時(shí)還(hái)與法國創業公司Gutenberg Technology—道,開發了(le)智能數字教科書(shū)。