问题
单项选择题
在数据处理过程中,删除多余的重复数据、补充缺失的数据、纠正或删除错误的数据,这些工作属于______。
A.数据清洗
B.数据加工
C.数据转换
D.数据分析
答案
参考答案:A
解析:刚收集到的数据一般还存在一些问题,还不能直接进入加工环节。例如,收到的问卷调查表中,有些数据互相矛盾,有些重要的数据缺失,有些数据是多余的。数据录入后又会产生一些错误。问题数据一般称为脏数据,需要先进行清洗才能进入加工环节。错误的数据要纠正或删除,多余的数据要删除,缺失的数据有多种补救方法(用平均值代替、用默认值代替、用特殊符号代替以便在统计时排除等),需要按照实际情况选用。