1.前言
微软必应地图(BingMaps)于年5月17日向世界各地发布开放的全球建筑物轮廓数据(暂不包括中国)。该团队在年至年间从BingMaps图像中(包括Maxar和Airbus影像)检测到了约7.77亿座建筑物,目前该套数据可在ODbL、GitHub等平台上免费下载和使用。
年5月发布的全球建筑物轮廓数据集是对该团队在年7月到年2月期间发布的其他版本的全面补充。
2.数据版本
年5月17日,微软必应地图团队发布包含涵了个建筑物轮廓数据的全球建筑物轮廓数据集GlobalMLBuildingFootprints
在此之前微软必应地图团队于年7月首次发布了部分国家地区的建筑物轮廓数据。
年7月,微软必应地图团队首次面向全球发布USBuildingFootprints数据集——该套数据涵盖美国50个州个计算机生成的建筑物轮廓。
年9月,发布了加拿大所有省份和地区的建筑足迹数据集,数据集包含个建筑物轮廓。
年1月,发布了乌干达和坦桑尼亚全国范围的建筑物轮廓数据集,数据集包含乌干达?个建筑物轮廓,坦桑尼亚?个建筑物轮廓。
年2月,发布了澳大利亚全国范围的建筑物轮廓数据集,数据集包含个建筑物轮廓。
年12月,发布了南美洲部分地区/国家的建筑物轮廓数据集,共计个建筑物轮廓。其中包含阿根廷个建筑物轮廓,玻利维亚个建筑物轮廓,巴西个建筑物轮廓,智利个建筑物轮廓,哥伦比亚个建筑物轮廓,厄瓜多尔个建筑物轮廓,圭亚那个建筑物轮廓,巴拉圭个建筑物轮廓,秘鲁个建筑物轮廓,乌拉圭个建筑物轮廓,委内瑞拉个建筑物轮廓。
年1月,发布了尼日利亚和肯尼亚全国范围的个建筑物轮廓数据集,数据集包含尼日利亚个建筑物轮廓,肯尼亚个建筑物轮廓。
年2月,发布了菲律宾、印度尼西亚和马来西亚全国范围的个建筑物轮廓数据集,数据集包含印度尼西亚个建筑物轮廓,菲律宾个建筑物轮廓,马来西亚个建筑物轮廓。
3.研究方法
微软在深度学习、计算机视觉和人工智能方面进行了大量投资,这些投资已经应用于地图绘制。在过去几年中,必应地图团队利用AI人工智能和计算机视觉的强大功能大规模识别地图要素,生成了高质量的建筑足迹。
依靠微软开发的开源CNTK统一工具包。将深度神经网络和ResNet34与RefineNet上采样图层结合使用,以检测必应影像中的建筑物覆盖区。
为了确保最佳输出,从预测中删除噪声和可疑数据,例如误报。然后,应用面化算法来检测建筑物边缘和角度,以创建适当的建筑物覆盖区。
建筑物提取分两个阶段完成:
(1)语义分割—使用深度神经网络(DNN)识别航空影像上的建筑像素。
(2)多边形化—将建筑像素检测转换为多边形。
4.数据评价
(1)评价指标
precision:准确率,表示预测结果中,预测为正样本的样本中,正确预测为正样本的概率;
recall:召回率,表示在原始样本的正样本中,最后被正确预测为正样本的概率;
IoU:全称为IntersectionoverUnion(交并比),是衡量目标重叠检测中最常用的标准指标。计算的是“预测的”和“真实的”边框的交集和并集的比值。是衡量标签重叠质量的标准指标;
Rotationerror:主导角旋转误差,用于测量多边形旋转偏差;
ShapeDistance:形状距离,测量多边形轮廓相似度;
Falsepositiveratio:假正率,表示所有负例中被错误地预测为正例的比例;FPR=FP/(FP+TN)。(2)评价结果5.数据信息
坐标参考:EPSG(WGS-84)
时间尺度:提取的建筑物覆盖区的年份取决于基础影像的年份。基础图像来自必应地图,其中还包括-年间的Maxar和Airbus的影像数据。
空间尺度:全球(暂不包括中国)
数据大小:83.6GB(压缩后)
数据格式:GeoJSON
作者团队:MicrosoftOpenSource、Andwoi等
意见反馈:opencode
microsoft.