6.农村低收入人口的收入低估问题
西财项目的《中国家庭金融报告2012》显示,2010年农村家庭收入25%分位数为6294元,根据这一数字以及农村家庭户均人口数(3.76人)计算,当年约有1.5亿的农村人口,其人均年收入小于1100元。这一结果与国家统计局在2010年的每人每年1274元贫困标准,以及由此确定的当年2688万人的农村贫困人口相差甚远。由此我们质疑西财数据严重低估了农村低收入人口的收入水平。不仅我们,许多细心的读者都发现了这一问题。西财项目有关城镇低收入家庭的收入估计也存在类似的问题。
对此,甘犁教授的回应是,《中国家庭金融报告2012》中的家庭收入分布数据在计算总收入时漏算了家庭成员第二职业的收入。根据补充了家庭成员第二职业收入之后的数据计算,农村居民家庭收入25%分位数为7860元。这意味着甘犁教授承认了其《报告》中公布的农村低收入家庭的收入数字是错的(但是没有承认与此相关的其它不准确的数字)。除此之外,甘犁教授在《再回应》还给出了下列的数字:“根据2010年的贫困标准(家庭人均年收入低于1274元)计算,农村贫困家庭数量占全国家庭总数的6.9%,据此推算的贫困家庭户数约为2672万。”
这一解释给我们带来了更大的疑虑。虽然都使用相同贫困标准,但是国家统计局估计的贫困规模为2688万人,而甘犁教授给出的贫困规模为2672万户。根据户均3.76人计算,后者界定的农村贫困规模为前者的近4倍。这样巨大的差异再次表明了,在农户收入统计上,国家统计局的农村住户调查较西财要更准确可靠,而西财住户调查低估了农村低收入人口的收入水平。
7.日记账调查与回忆式调查的优缺点问题
作为入户调查时的数据收集方式,西财采用了一次性回忆方式。与此不同,国家统计局住户调查对收入、消费等家庭财务指标采用了日记账的方式。考虑到家庭收入和支出发生频度较高、多数情况下金额较小的事实,我们认为国家统计局通过日记账收集到的收入和消费信息较西财一次性方式更准确、更可靠。这一点在农村住户调查中尤其如此。
对此,甘犁教授在《回应》中对日记账列举了三大缺点:第一,记账式调查的拒访率高,引起很大的样本偏差;第二,由于日记账的方式没有访员在现场指导,因此对记账指标的理解不一致会造成较大的数据偏差;第三,日记账的数据缺乏监督机制,更容易产生数据错报。由于记账指标繁杂且记账时间较长,受访户往往由于记账负担过重而少报或胡乱报,严重影响数据收集的质量。
我们不能同意甘犁教授这种对日记账的描述,在《再质疑》中并作出了如下的回应:
“甘犁教授对日记账种种缺陷的大部分讨论属于直觉猜测,经不住推敲。这在很大程度上说明甘犁教授对国内住户调查的记账系统和操作过程不甚了解。由于记账是由调查员(辅助调查员)协助调查户进行的,既不会出现教授所认为的“对记账指标的理解不一致会造成较大的数据偏差”,也不会出现“受访户往往由于记账负担过重而少报或胡乱报,严重影响数据收集的质量”的情况。而且,由于记账原则上是每天进行的,因此记账负担并没有想象的那样重。相反,由于人的记忆力的局限性,一次性回忆的数据收集方式客观上会丢失很多信息,在收集收入和消费等信息方面尤其如此。本文作者与许多国外研究收入分配的专家也讨论过这个问题,他们都对记账式的收入调查方式给予高度评价。他们认为这种方式在发达国家做不了,主要是因为“成本太高了”。但是这种高成本在一定程度保证了数据的准确性。”
对此,甘犁教授在《再回应》中作出了如下的反应:
“需要澄清的是,我们只是客观陈述了“回忆式”调查和“记账式”调查各自的特点,以及回忆式调查被国内外广为采用的客观事实。我们一再强调,两种调查方法各有优缺点,说哪种调查方法更优并无根据。反倒是《再》文作者在承认“记账式”调查存在缺陷的情况下,对“回忆式”调查方式全盘否定,得出“记账式”方法优于“回忆式”调查这一结论,进而全盘否定CHFS数据的可靠性,对这样的《质疑》不仅我们不能接受,国际上绝大多数抽样调查机构也不会接受。”
以上是关于住户调查中日记账和回忆式数据收集方式的争论,对此我们想做以下的补充:我们熟知日记账和回忆式各自的优缺点,同时也知道世界绝大多数住户调查的数据收集方式的回忆式,而不是日记账。但重要的不是简单地、单靠逻辑推理地罗列某种方式的优点或缺点,而是通过挖掘不同数据收集方式发挥其长处的环境和前提条件,对现实中实施的不同数据收集方式给出比较和评价。在这一点上,我们相信,甘犁教授是前者,而我们是后者。