首页>旗帜动态>
学术研究 >王广州:中国人口平均预期寿命预测及其面临的问题研究
王广州:中国人口平均预期寿命预测及其面临的问题研究
中国社会科学院人口与劳动经济研究所研究员、中国人口学人口预测研究领域专家王广州在《人口与经济》发表了文章,就中国人口平均预期寿命预测及其面临的问题研究阐述了自己的观点。
以经典的Lee-Carter死亡率模型为工具,采用中国1994-2019年死亡数据,构建Lee-Carter死亡率模型,研究中国人口平均预期寿命预测问题。研究表明:虽然中国死亡数据资源越来越丰富,但不同来源数据质量差距和冲突依然比较明显。随着死亡水平的下降,1994年以来1‰人口变动抽样调查死亡数据面临的质量问题比较突出。从Lee-Carter死亡率模型拟合效果来看,模型拟合年龄别死亡率平均相对误差较小的年龄组为40-84岁,0岁组拟合效果较差,而0岁人口死亡率的数据质量在模型拟合、平均预期寿命推算和预测过程中非常重要。由于年龄别死亡率数据误差相抵的原因,对出生人口预期寿命的推算误差明显下降。在平均预期寿命研究结果的应用过程中,对不同年龄人口的平均预期寿命的相对误差和绝对误差需要区别对待。考虑到中国历史数据的质量问题,在建模过程中需要防止模型对基础数据的过度拟合问题。由于死亡人口重报,特别是多报的可能性很小,因此现有数据和模型对平均预期寿命的估计或预测肯定是一个高估。
长期以来,平均预期寿命不仅是联合国开发计划署人类发展指数(HDI)构建的三大重要基础变量之一,同时也是中国国民经济和社会发展规划的重要指标。无论是健康中国战略还是积极应对人口老龄化国家战略都离不开对未来健康水平战略目标的监测评估,而平均预期寿命正是连接和判断两大国家战略进展情况的重要统计指标和分析工具。
虽然对平均预期寿命不断增长的目标和方向不变,但具体到未来社会经济发展能够使得平均预期寿命有多大的变化,却是一个非常困难的研究问题,特别是不同区域或省际之间如何设定规划目标困难重重。目标太低,很快实现了。目标太高,又无法判断是否确实难以达到,很难确认是预测出现很大偏差还是基础数据问题引起的误判。因此,科学测量和准确预测平均预期寿命的基本状况和变化趋势,不仅具有重要的科学研究价值,同时也具有非常重要的现实意义。
平均预期寿命预测包括两部分研究工作,第一部分是对年龄别死亡率的预测,第二部分是根据预测的年龄别死亡率建立相应的生命表,从而得到平均预期寿命的预测结果。对年龄别死亡率的预测通常采用Lee-Carter 模型。Lee-Carter 模型是该领域研究最典型的方法,对死亡率随机预测研究影响巨大,世界各国相关应用和方法改进文献不计其数。
回顾中国预期寿命研究的历史,由于基础数据收集主要是人口普查、1%人口抽样调查和年度1‰人口变动抽样调查,基础数据质量和数量都受到很大限制,因此多数应用是根据模型生命表进行经验估计。随着死亡率数据的增加,预测模型效果是否有所改善,效果如何,都需要认真研究和深入探讨。此外,Lee-Cater模型在中国具体应用过程中很少涉及对不同年龄预期寿命预测结果的进一步讨论或预测结果的实证检验。特别是在应用过程中,反而忽略了基础数据本身问题对预测偏差的影响。
虽然目前国内有很多学者采用中国或国外数据对Lee-Carter模型进行了一些相关应用研究,但绝大多数研究采用国外学者编制的R语言程序,并没有对算法的实际计算过程和所有细节进行重复演算或验证,包括对Lee-Carter(1992)文献也没有进行仔细的重复检验,同时,在研究过程中,还存在为了模型拟合“效果”舍弃重要可获得数据的现象。
本文采用Python语言对相关研究进行重复检验,并对计算过程的细节进行尽可能完整的描述,目的是在检验Lee-Carter模型的同时,补充一些文献对关键算法语焉不详或订正相关研究可能存在的缺陷或错误,也有利于研究者对本研究的重复检验。
采用Lee-Carter模型进行平均预期寿命预测需要完成四个步骤:第一步,通过历史数据需要对ax、bx和kt进行参数估计;第二步,对kt进行预测,预测的方法可以采用时间序列回归或自回归模型;第三步,对年龄别死亡率进行预测;使用ax、bx和预测的kt对nmx,t进行预测;最后,通过预测nmx,t得到平均预期寿命预测结果。
采用Lee-Carter模型进行中国平均预期寿命预测的关键是通过时间序列历史数据对参数ax、bx和kt进行估计,通过实际数据对模型的估计结果进行检验,并以此为基础,对中国人口平均预期寿命预测结果进行分析。
总之,虽然不同年龄死亡率预测结果与调查值之间存在的差距不同,而且40岁人口的波动比较大,由于误差相抵的原因,出生人口的平均预期寿命与实际调查推算值之间存在误差,但误差的范围在2%以内。模型预测与调查值之间的差别一方面反映了模型拟合的需要改进的问题,另一方面也说明数据质量本身面临的困难和导致的问题。如果调查数据精度很高,那么,不太可能出现平均预期寿命的大幅度下降或上升,也不太可能发生婴儿死亡率的大幅度上升,考虑到与国家卫生统计婴儿死亡率的一致性,因此,在基础数据和模型应用过程中,需要对基础数据、模型的偏差方向应该有一个基本的判断和正确的理解。
总之,死亡人口的数据质量问题是影响未来平均预期寿命预测的基础性因素,与其他数据不同,死亡人口漏报的可能性远远大于重报,更不太可能存在利益驱动的多报。因此,目前收集到的数据死亡人口数低估的可能性远远大于高估的可能性。特别是卫生统计年鉴公布的婴儿死亡率不仅一直高于国家统计局人口普查和抽样调查推算的数据,而且两者的差距无论是绝对差距还是相对差距都随着死亡水平下降而逐渐扩大。考虑到低龄人口死亡是一个小概率事件,因此,分子漏报对死亡率或死亡概率的计算非常敏感,且具有死亡水平越低,漏报对相对误差影响越大的特点。因此,采用现有数据及其所构建的模型为基础,对未来中国人口平均预期寿命预测结果的估计处于均值与下限之间,或更接近下限的可能性更大一些。
本项研究的主要目的是在中国现有数据条件下考察应用Lee-Carter模型面临的问题和挑战,尝试或探索对中国人口平均预期寿命的变化趋势和水平有一个估计,从而形成与经验估计或趋势外推结果的对照和互验,避免在中国平均预期寿命实际变化趋势或水平研究过程中由于研究者仅凭主观想象或判断可能引起的严重偏差与误判。
王广州,中国社会科学院人口与劳动经济研究所研究员、中国人口学人口预测研究领域专家,主要研究方向为数理人口学、应用人口学,专业特长为人口分析技术、统计分析方法、抽样技术和计算机软件开发等方面。