什么是数据缺失?

数据缺失是指在数据收集、存储或处理过程中,部分观测值或变量信息未被记录或无法获取的现象。这种现象在心理学与管理学研究中尤为常见,例如问卷调查中受访者跳过某些问题、实验过程中设备故障导致记录中断,或是纵向研究中参与者中途退出。数据缺失并非随机发生,其机制可大致分为完全随机缺失、随机缺失与非随机缺失三类,不同类型的缺失机制对数据分析的准确性与结论的可靠性会产生截然不同的影响。

在认知科学与行为决策研究中,数据缺失往往与人类的认知偏差和行为模式密切相关。例如,受访者可能因问题敏感而拒绝回答,或因认知负荷过高而选择性忽略复杂项目,这类缺失本身即反映了决策过程中的系统性特点。若忽视缺失机制直接进行分析,可能导致参数估计偏差、统计功效降低,甚至得出完全错误的科学推论。因此,研究者需通过多重插补、最大似然估计等统计方法对缺失数据进行处理,并在研究设计中预先考虑缺失数据的预防策略。