教育線眼:網上評估加「因材施測」非一兩年成事 ╱文:余諫之
【明報專訊】教育大學評估研究中心總監莫慕貞提出將現有網上評估系統「STAR平台」改良為「因材施測」的KDCAT(Knowledge-structure-based Dynamic Computer Adaptive Testing,即動態電腦化適性評估系統),但她稱因意見在檢討TSA委員會「不被聽到」而辭任委員。據筆者了解,STAR其實已很落後,若要與時並進,就要加入因材施測及人工智能評卷功能,需花龐大費用,亦非一兩年能成事。
系統遠遜內地
教育統籌委員會於2000年因應教改,建議設立基本能力評估(BCA),當中包括TSA及SA(學生評估)。SA有試題庫供學校使用,當年由「考試局」負責出題目,為確保題目優質,要經多人審閱及修訂,首數年每年僅得數十條題目,用戶亦少。SA發展緩慢,至2016學年停用,變成STAR,由教育城管理,除中央試題庫外,亦有電腦化評卷及提供學生評估報告,但系統已遠遠落後於內地。
STAR欠缺的,首先是因材施測功能。因材施測不再是全體學生做同一份試卷,而是因應學生程度為其選題目,舉例,學生先做3條題目,電腦按其成績分配第4題,再按第4題表現分配第5題,餘此類推,藉此更準確評估學生程度,作出回饋。此系統成本非常高,首先要將題目按深淺排序,數學題還較易分深淺,語文則較困難,例如解讀不同文體和內容的文章,題目程度可能「難分高下」。將題目排序後,還要有大批考生試考,分析其表現再輸入電腦,電腦才懂得如何因應考生在某一題的表現,為其揀選下一條題目。
改革與否 教局明年初揭盅
STAR另一欠缺是人工智能。有人工智能的系統不再限於自動評改短題目和選擇題,而是電腦輸入大量人工改卷的資料後,已能讀得懂作文內容、結構、寫作手法等,自動為作文評分,人工智能也能代替考官為考生考口試及評分。
教育局稱料明年初就STAR的發展有初步建議,當局是否願意投放大量資源令STAR追上評估潮流,教育界拭目以待。
余諫之