进入RECOVERY模式,有清除数据这一项。
用来自多个 联机事务处理 (OLTP) 系统的数据生成 数据仓库的进程的一部分。该进程必须解决不正确的拼写、两个系统之间冲突的拼写规则和冲突的数据(如对于相同的部分具有两个编号)之类的错误。
编码或把资料录入时的错误,会威胁到测量的效度。数据清理主要解决数据文件建立中的人为误差,以及数据文件中一些对统计分析结果影响较大的特殊数值。常用的数据清理方法包括可编码式清理和联列式清理。
数据清理是一个过程,它包括两步:第一步是偏差检验,第二步是数据变换。同时这两步迭代进行。