武漢大學夏桂松老師
1. 【遙感數據集】iSAID: 面向航空影像的大型實例分割數據集
遙感領域迎來了一項重大突破,武漢大學夏桂松團隊推出了全新的大型實例分割數據集iSAID。這個數據集包含了15類,共655,451個目標實例,圖像數量達到2,806張,是首個此類數據集。
iSAID的圖片使用DOTA數據集進行像素級標注,並修正了DOTA數據集中的錯誤。與DOTA數據集相比,iSAID的樣本量和標注精細程度都有顯著提升。數據集中的目標類別包括:飛機、船隻、儲罐、棒球場、網球場、籃球場、田徑場、港口、橋梁、大型車輛、小型車輛、直升機、圓形建築、游泳池、足球場等,涵蓋了城市遙感解譯的關鍵目標。數據集的1/2用於訓練,1/6用於驗證,1/3用於測試。官方已設置測評伺服器,可用於在線評測演算法在測試集上的性能。
iSAID數據集展現了遙感圖像中的常見特徵和尺度分布差異。其中,10到144像素為小目標,144到1024像素為中目標,1024及以上像素為大目標,這三類尺寸的目標佔比分別為52.0:33.7:9.7。數據集中最大和最小的物體面積差異可以達到20,000倍,同時存在大量極端長寬比的物體。
針對iSAID數據標注,作者設定了嚴格的標注標准,包括所有可見目標都必須標注,目標掩膜必須與其在圖像中的可見邊緣吻合,必要時通過縮放來標注目標的准確邊緣等。所有標注者都經過嚴格訓練和測試,每位標注人員需要約3.5小時來完成一張圖片的標注。標注完成後,還需經過一個5步質量控制過程來保證標注質量。
在演算法實驗部分,作者使用Mask R-CNN和PANet進行了實驗,並使用演算法默認的超參數進行訓練。遙感實例分割是22年計劃要做的一個方向,iSAID是需要重點關注的數據集。作者指出,大尺寸遙感圖像的數據切割和合並會明顯影響最終評測得分,這也許是一個研究方向。