本数据集为“MLRSNet”的新型大规模高分辨率多标签遥感数据集,用于语义场景理解。该数据集包含109,161张高分辨率遥感图像,这些图像被标注为46个类别,每个类别的样本图像数量在1500到3000之间。这些图像的固定尺寸为 256×256像素,且具有不同的像素分辨率。此外,数据集中的每张图像都标注了60个预定义类别标签中的多个,每个图像关联的标签数量在1到13之间。此外,详细阐述了MLRSNet数据集的构建流程,并评估了多种基于多标签的深度学习方法在图像分类和图像检索任务中的性能。实验结果表明,基于多标签的深度学习方法在图像分类和图像检索任务中能取得更优性能。该数据集是目前最大的高分辨率多标签遥感数据集,包含最丰富的多标签信息。且该数据集具有较高的类内多样性,可为语义场景理解领域中众多方法的评估与发展提供更优质的数据资源。
数据量 | 1.2 GiB |
---|---|
数据格式 | jpg,csv |
数据空间分辨率(/米) | 10-0.1米 |
坐标系 |
MLRSNet 由来自世界各地的 109,161 张标记的 RGB 图像组成,分为 46 大类:飞机、机场、裸地、棒球场、篮球场、海滩、桥梁、丛林、云、商业区、密集住宅区、沙漠、侵蚀农田、农田、森林、高速公路、高尔夫球场、地面田径场。港口和港口、工业区、十字路口、岛屿、湖泊、草地、移动房屋公园、 山、立交桥、公园、停车场、公园大道、铁路、火车站、河流、环形交叉路口、船坞、雪山、稀疏的住宅区、体育场、储罐、游泳池、网球场、露台、输电塔、蔬菜温室、湿地和风力涡轮机。样本图像的数量因不同的大类而变化很大,从1500张到3000张不等。此外,数据集中的每张图像都分配了 60 个预定义类标签中的几个,并且与每个图像关联的标签数量在 1 到 13 之间变化。
MLRSNet的建设主要由场景样本采集、数据库质量控制和数据库样本多样性改进三个过程组成。
相比之下,与现有的遥感图像数据集相比,MLRSNet具有以下显著特点:
1、层次结构:MLRSNet包含3个一级类别,如土地利用与土地覆盖(例如商业区、农田、森林、工业区、山地)、自然物体与地貌(例如海滩、云层、岛屿、湖泊、河流、灌木丛),以及人工物体与地貌(例如飞机、机场、桥梁、高速公路、立交桥), 46 个二级类别和 60 个三级标签。
2、多标签:MLRSNet数据集中的每张图像都对应一个或多个标签,因为遥感图像通常包含多种不相互排斥的物体类别。多项实验表明,在图像分类或图像检索任务中,多标签数据集往往能取得比单标签数据集更优异的性能。
3、大规模:MLRSNet包含大量高分辨率多标签遥感场景图像。该数据集包含109,161张高分辨率遥感图像,被标注为46个类别,每个类别的样本图像数量在1500至3000之间,均大于其他大多数列出的数据集。MLRSNet是一个为场景图像识别收集的大规模高分辨率遥感数据集,可覆盖更广泛的卫星或航空图像范围。它旨在作为替代方案,推动场景图像识别方法的发展,特别是需要大量标注训练数据的深度学习方法。
4、多样性:为提升数据集的泛化能力,我们尝试根据地理分布、季节分布、天气条件、视角、采集时间及图像分辨率等维度对 MLRSNet 进行特征描述,即在空间分辨率、视角、物体姿态、光照、背景以及遮挡等方面存在显著差异。
# | 标题 | 文件大小 |
---|---|---|
1 | MLRSNet:用于语义场景理解的多标签高空间分辨率遥感数据集.zip | 1.2 GiB |
2 | _ncdc_meta_.json | 6.8 KiB |
# | 时间 | 姓名 | 用途 |
---|---|---|---|
1 | 2025/08/01 23:00 | 匿名 [1.203.169.* ] |
[开放下载]
|
2 | 2025/08/01 22:46 | 匿名 [123.127.143.* ] |
[开放下载]
|
3 | 2025/08/01 22:37 | 匿名 [1.203.169.* ] |
[开放下载]
|
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596