目前,统计部门对外公布的各种报告中,都会附有该项调查的统计口径、统计样本、统计方法以及具体名词的解释,以便研究机构或大众媒体更科学地解读和运用数据。比如目前的“城镇登记失业率”,这项统计针对的是非农业户口、在一定的劳动年龄内、有劳动能力、无业而要求就业并在当地就业服务机构进行求职登记的人员,不包括农村劳动力、国有及集体企业下岗职工,以及未主动登记的其他城镇失业人员;“城镇职工平均工资”,包括了工资、津贴、奖金,以及个人应交纳的养老、医疗、住房等个人账户的基金和税金。
不过也有人建议,这些民生调查的统计口径与样本应继续完善,使之更合乎现实国情。例如,城镇居民人均居住月支出调查中80%的样本为自有房住户,这一比例是否偏高?如果以该统计数据为参考,那么各地是否会丧失巩固房地产调控政策、大力发展保障房的动力?如果“失业率”的统计口径与方法能随着时代发展而不断完善,是不是就会使感觉自己“被就业”的人群相应减少呢?
■仅凭平均数可能会被误导?
平均数不能代表一组数据,更不能反映一组数据间有多大差异,还会受到极端值的巨大影响
大学生小仇还没毕业,就掉进了“平均数的陷阱”。她曾到一家展会公司求职,被老板告知企业平均工资为3000元,她的实习起薪是800元。后来她托熟人一打听,发现公司业务员的薪水都是1000元,便去找老板理论。
老板给她算了一笔账:公司业务员10名,薪水1000元;业务经理5名,薪水2000元;部门主管6名,薪水2500元;副总经理拿10000元,总经理拿24000元。由于收入差距悬殊,全体人员一平均,平均工资确实是3000元。而对于小仇这样的求职者而言,一组数据中出现最多的数值――众数,即大多数员工的工资1000元,以及一组数据从小到大排列位于中间的数值――中位数,即员工中等工资2000元,可能比平均数更具有参考价值。