本数据集主要基于中高分辨率(30m)的Landsat8遥感数据集,选择成都市七环内地区为研究区域,采用随机森林的分类方法,解译提取了该区域2020年的水田、旱地、草地、林地、建设用地、水域及水利设施用地及其他用地共7种土地利用类型,并计算了混淆矩阵、总体精度与Kappa系数以验证精确性,其数据精度与同类型和同级别的产品精度相近。该数据可以用于成都市土地资源和现状调查具有重要支撑作用,对于了解成都市土地利用格局研究也具有重要意义。
孙莹
WorldPop 在全球和各个国家范围内,生成各种人口网格化数据产品,包括3弧秒的格网数据 (在赤道上约为100m). 人口数据生产主要方法是加权分区密度制图,该方法依赖于随机森林模型来生成预测加权层将人口数量重新分布到网格单元中。WorldPop项目为各个国家和许多地区,包括中美洲和南美洲、非洲和亚洲,提供了一个开放存取、透明记录的空间人口数据集档案,以支持发展、救灾和卫生应用。所有数据都可以从下载https://www.worldpop.org/project/list.
Andrew J. Tatem
数据来源:国家统计局官网(http://www.stats.gov.cn/tjsj/pcsj/)。 以第七次人口普查数据为例,以下为编辑说明内容:一、普查对象和标准时点:第七次全国人口普查的普查对象指普查标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的境外人员。普查标准时点为2020年11月1日零时。二、普查表式:第七次全国人口普查采用长、短两种普查表。普查短表包括反映人口基本状况的项目,由全部住户(不包括港澳台居民和外籍人员)填报;普查长表包括所有短表项目和人口的经济活动、婚姻生育和住房等情况的项目,在全部住户中抽取10%的户(不包括港澳台居民和外籍人员)填报。三、资料主要内容:本资料分为三部分。第一部分是全部人口数据,主要反映人口的基本状况,分为八卷,共196张表;第二部分是普查长表数据,主要反映人口的各种结构情况,分为九卷,共218张表;第三部分是附录,主要是普查的有关规定和技术文件等。四、数据汇总口径及推算说明:本资料是普查实际登记直接汇总的数据,不包括漏登的人口(事后质量抽查表明,人口漏登率为0.05%),不包括200万现役军人。资料中各项指标的汇总结果未做任何误差校正,读者在使用时应考虑不同指标登记误差因素的影响。由于普查长表是按户抽样并进行登记,因此人口总数以及各种人口结构数据的抽样比会存在略微差异,请读者使用本资料推算总体时,对采用的方法予以注意。五、城乡划分规定:本次人口普查关于城乡的划分,按照国家统计局《统计上划分城乡的规定》执行。六、其他:本资料中部分相对数由于单位取舍问题而产生的计算误差,均未做机械调整。本资料中空项表示无数字或数字很小。
国家统计局
一普到六普的区县级人口数据(包括Excel格式和SHP格式)来自高亮、宋栋栋等研究者分享,网址:https://www.scidb.cn/detail?dataSetId=849628989872930816,七普人口数据来源于网站city population(网址为:http://www.citypopulation.de/),使用的省市县三级的行政区划数据为公众号“数读城事”整理的最新的2021年行政区划数据。利用ArcGIS中的‘空间连接’工具分别将省级七普人口连接到省级行政区划上,将市级七普人口连接到市级行政区划上,将区县级七普人口连接到区县级行政区划上,在空间连接后有些数据没有匹配上,直白点说就是有些行政单元没有匹配上七普人口值,数据有缺失,要对这些缺失数据进行逐一排查。具体处理流程见网址:https://mp.weixin.qq.com/s/EK0O2547yMURzfzx-TBbXA 和 https://mp.weixin.qq.com/s/NwWe20dS0pvBBMOK8fhOUw
高亮
全球 1km 根据联合国世界人口展望调整后的人口密度格网数据集,包括基于与国家人口普查和人口登记相对空间分布相一致的计数的人口密度估计值(每平方公里人口数),但经过调整以匹配2000、2005、2011、2015和2020年《联合国世界人口展望2015年修订版》国家总数。使用比例分配网格算法,利用约1350万个国家和地方行政单位,将联合国世界人口展望调整后的人口数分配到30弧秒网格单元。密度栅格是通过将联合国WPP调整的给定目标年人口计数栅格除以陆地面积栅格而创建的。数据文件为30弧秒(赤道约1公里)分辨率。该数据集提供基于调整后匹配联合国国家总数与国家人口普查和人口登记册,且相对空间分布相一致的计数,包括2000年、2005年、2010年、2015年和2020年的人口密度估计数。
Center for International Earth Science Information Network - CIESIN - Columbia University
经济活动对人类的生存和发展至关重要。在社会组织和秩序的推动下,人类利用劳动和其他生产资源来交换商品和服务,以创造、转化和实现经济价值。一个国家或地区的经济产出是其在一定时期内创造的经济价值的积累;其中,国内生产总值(GDP)是全球最普遍的指标。该数据集采用自上而下的方法,根据校准后的夜间光照数据,从修订后的实际增长角度来计算1992-2019年间全球1km×1km网格化修订后的真实GDP。网格化数据的范围并未涉及全球所有国家(175个国家或地区的GDP数据)。因此,超出我们研究范围的区域值设置为0。官方GDP数据来自宾夕法尼亚大学世界数据库。此外,将所有图像的投影坐标系设置为Mollweide坐标。
Yu Liu, MingGao
此数据集拥有2000-2020年的网格人口密度分布数据,分辨率为1km,投影为地理坐标系WGS84。基于联合国秘书处经济和社会事务部人口司编制的相应联合国官方人口估计数(2019年《世界人口展望》修订版),WorldPop研究团队对模型进行校正,在此基础上采集2001~2015年的西南地区人口空间分布数据,选择其中具有完整乡镇数据人口的地区作为检验样本,进行模型结果检验,最后经过重采样,形成一套具有统一空间坐标参数、统一数据格式、统一元数据标准的2001~2015年西南地区250 m网格人口空间分布数据集。
WorldPOP
此数据集拥有2000~2020年的网格人口分布数据,分辨率为3-arc(约为100m),投影为地理坐标系WGS84。基于联合国秘书处经济和社会事务部人口司编制的相应联合国官方人口估计数(2019年《世界人口展望》修订版),WorldPop研究团队对模型进行校正,在此基础上采集2001~2015年的西南地区人口空间分布数据,选择其中具有完整乡镇数据人口的地区作为检验样本,进行模型结果检验,最后经过重采样,形成一套具有统一空间坐标参数、统一数据格式、统一元数据标准的2001~2015年西南地区250 m网格人口空间分布数据集。
WorldPOP
覆盖中国30个省(直辖市、自治区)(西藏、香港、澳门和台湾因缺少数据,没有计算),是2005-2014历年各省(直辖市、自治区)的数据。数据集包括:(1)农村水贫困指数及其相关指标数据,包括:人均供水量、人均水资源量、农村自来水受益人口比例、节水灌溉面积比重、农村人均纯收入、平均受教育年限、水的生产力、人均生活用水量、农药使用强度和化肥使用强度;(2)农业现代化水平指数及其相关指标数据,包括:农业劳均经济产出、农业劳均主要农产品产量、农业机械化程度和农业灌溉指数;(3)中国农村水贫困与农业现代化水平的耦合协调度与基尼系数。该数据集是在中国统计年鉴、中国农村统计年鉴、中国水利统计年鉴等相关统计数据基础上计算得到。数据集存储为.xlsx格式,1个数据文件,数据量为85.2 KB。该数据集的分析研究成果发表在《地理科学》2018年38卷第5期。
赵雪雁
LandScan Global 采用结合了地理空间科学、遥感技术和机器学习算法的创新方法,是可用的代表环境(24 小时平均值)人口的最高分辨率全球人口分布数据。 LandScan Global 算法是 R&D 100 奖得主,它使用空间数据、高分辨率图像开发和多变量 dasymetric 建模方法来分解行政边界内的人口普查计数。由于没有单一的人口分布模型可以解释空间数据可用性、质量、规模和准确性的差异以及文化定居实践的差异,LandScan 人口分布模型是为匹配每个国家的数据条件和地理性质而量身定制的和地区。通过对环境人口进行建模,LandScan Global 在白天和黑夜的整个过程中捕获人们的全部潜在活动空间,而不仅仅是住宅位置。
Oak Ridge National Laboratory