本数据集基于MCD19A2、MOD13A3、MCD12Q1、MERRA-2、ERA5和CHAP数据集,通过数据预处理、数据上采样、时空匹配将气溶胶光学厚度、归一化植被指数、土地覆盖类型、气象参数等多种数据提取,将中国环境监测总站地面站点观测值作为目标真值,利用机器学习算法LightGBM训练模型,反演2000年至2022年“一带一路”沿线区域的逐日1公里分辨率沙尘颗粒物产品。本次沙尘颗粒物浓度数据集为“一带一路”沿线区域的沙尘研究提供基础数据。
1. 数据集命名:2011001.h22v04.tiff
201101表示日期,h22v04对应MCD19A2的瓦片,tiff文件中的波段1即为多对应的浓度值。
2.量纲(度量单位):毫克/立方米
3.每张tiff图像大小为1200×1200像素
采集时间 | 2000/01/01 - 2022/12/22 |
---|---|
采集地点 | “一带一路”沿线区域 |
数据量 | 1.7 TiB |
数据格式 | *.tiff |
数据空间分辨率(/米) | 1km |
数据时间分辨率 | 日 |
坐标系 |
1.MCD19A2、MOD13A3、MCD12Q1数据从MODIS官方网站(https://modis.gsfc.nasa.gov//)下载 。
2.MERRA-2 tavg1_2d_aer_Nx数据从从美国宇航局戈达德地球科学数据和信息服务中心(https://disc.gsfc.nasa.gov/)下载。
3.ERA5-Land 数据从欧洲中期天气预报中心(https://cds.climate.copernicus.eu/) 下载。
4.CHAP 数据从青藏高原数据科学中心(https://data.tpdc.ac.cn/home) 下载。
1. 遥感数据预处理:对MCD19A2不同波段的有效数据取平均,MERRA-2(0.5°×0.625°)和ERA5-Land(0.25°×0.25°)分别通过双线性插值采样至1公里分辨率,用MERRA-2填补MCD19A2的缺失值,然后按照最近点像素的方式时空匹配,提取所需数据。
2. 反演方法:采用最终采用LightGBM模型分别训练两个模型:(1)校正模型(主要针对中国区域),即把CHAP的数据也作为预测因子输入到模型中,最后再把反演的结果取平均后作为最终的结果;(2)原始模型(主要针对中国以外的其他区域)。
数据精度(使用2014-2022年的所有样本数据):
校正模型:基于样本的十折交叉验证PM10的R_2、MAE、RMSE分别为0.95、4.83、13.84,PM2.5的R_2、MAE、RMSE分别为0.96、3.27、7.00;
原始模型:基于样本的十折交叉验证PM10的R_2、MAE、RMSE分别为0.86、12.05、24.30,PM2.5的R_2、MAE、RMSE分别为0.89、7.23、12.20。
# | 编号 | 名称 | 类型 |
1 | 2022YFF0711702-04 | 沙漠、沙尘数据融合制备技术及长时序高质量数据制备 | 国家重点研发计划 |
# | 标题 | 文件大小 |
---|---|---|
1 | 2000 | |
2 | 2001 | |
3 | 2002 | |
4 | 2003 | |
5 | 2004 | |
6 | 2005 | |
7 | 2006 | |
8 | 2007 | |
9 | 2008 | |
10 | 2009 |
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596