武汉大学夏桂松老师
1. 【遥感数据集】iSAID: 面向航空影像的大型实例分割数据集
遥感领域迎来了一项重大突破,武汉大学夏桂松团队推出了全新的大型实例分割数据集iSAID。这个数据集包含了15类,共655,451个目标实例,图像数量达到2,806张,是首个此类数据集。
iSAID的图片使用DOTA数据集进行像素级标注,并修正了DOTA数据集中的错误。与DOTA数据集相比,iSAID的样本量和标注精细程度都有显著提升。数据集中的目标类别包括:飞机、船只、储罐、棒球场、网球场、篮球场、田径场、港口、桥梁、大型车辆、小型车辆、直升机、圆形建筑、游泳池、足球场等,涵盖了城市遥感解译的关键目标。数据集的1/2用于训练,1/6用于验证,1/3用于测试。官方已设置测评服务器,可用于在线评测算法在测试集上的性能。
iSAID数据集展现了遥感图像中的常见特征和尺度分布差异。其中,10到144像素为小目标,144到1024像素为中目标,1024及以上像素为大目标,这三类尺寸的目标占比分别为52.0:33.7:9.7。数据集中最大和最小的物体面积差异可以达到20,000倍,同时存在大量极端长宽比的物体。
针对iSAID数据标注,作者设定了严格的标注标准,包括所有可见目标都必须标注,目标掩膜必须与其在图像中的可见边缘吻合,必要时通过缩放来标注目标的准确边缘等。所有标注者都经过严格训练和测试,每位标注人员需要约3.5小时来完成一张图片的标注。标注完成后,还需经过一个5步质量控制过程来保证标注质量。
在算法实验部分,作者使用Mask R-CNN和PANet进行了实验,并使用算法默认的超参数进行训练。遥感实例分割是22年计划要做的一个方向,iSAID是需要重点关注的数据集。作者指出,大尺寸遥感图像的数据切割和合并会明显影响最终评测得分,这也许是一个研究方向。