Page 135 - 教育模式创新理论研究与实践
P. 135
第五章 大数据对高校教育管理的影响
标准化的依据和标尺。目前,国内外大数据标准化工作尚处于起步阶段,还未形
成一套公认的、完整的大数据标准体系,绝大多数的大数据标准化工作尚处于标
准的需求分析和研究探讨阶段。中国是 ISO/IEC JTC 1/SC36 的正式成员国,有 3
人担任此工作组的召集人,9 人担任国家标准项目编辑,主导的 4 项国际标准和
参与的 16 项标准工作项目中表达了符合中国利益的意愿。大数据标准体系主要
包括大数据通用技术标准、大数据产品标准、大数据行业应用标准、大数据安全
标准。中国目前已发布 19 项国家标准、7 项教育行业标准;待发布 7 项教育行
业标准;在研 34 项国家标准,17 项行业标准。为了适应国际国内教育信息化发
展的要求,CELTSC(教育部教育信息化技术标准委员会)根据国家要求和市场
需求,新成立了在线课程类、智慧校园类、教育云等 6 个新的工作组(研究组),
并已经针对 MOOCs、智慧教育、教育大数据分析等领域开展国家标准和行业标
准的研制。2014 年 12 月 . 全国信息技术标准化技术委员会大数据标准工作组正
式成立,工作组包括了北京大学、阿里、华为、京东、国家信息中心等 150 家申
请单位。2015 年底,已完成草案的标准有《信息技术大数据术语》《信息技术
大数据技术参考模型》等 8 个国家标准,正在研制的有《信息技术数据质量评价
指标》《信息技术通用数据导入接口规范》等 2 项国家标准。高校大数据同样也
需要标准化处理,尽量减少混乱无序的数据、信息、资源,这样才可消除“信息
孤岛”现象,增强教育数据的可用性、通用性和互操作性,从而促进数据整体价
值的提升。武汉大学、复旦大学等高校在数据标准化方面进行了初步尝试,取得
了一定成绩。但是,就中国高校整体而言,并没有形成一套完善的、可通用的数
据标准体系。
(五)数据质量问题
“数据质量”主要指数据资源满足用户具体应用的程度。数据质量主要从
完整性、规范性、一致性、准确性、唯一性、关联性几个角度综合评估,度量哪
些数据丢失了或者不可用,哪些数据未按统一格式存储,哪些数据的值在信息含
义上是冲突的,哪些数据是不正确的或超期的,哪些数据是重复的,哪些关联的
数据缺失或未建立索引。数据质量是依据数据科学决策的保障,质量化下的数据
决策比没有数据的“拍脑袋”决策更可怕。根据 Experian Data Quality 的数据,
88% 的企业的收支情况都会受到不准确数据的影响,而且受影响的营收比例高达
12%。因此,高校大数据的质量必须从源头抓起,从何而来?是否准确?以谁为
127