压缩图像预测模型:测绘学报杜佳威
压缩图像预测模型:测绘学报杜佳威关键词:地图综合 化简 机器学习 人工神经网络 摘要:为充分利用已有化简成果及其蕴含的化简知识 本文集成几种机器学习算法提出图形、图像融合利用的智能化简方法 实现顶点取舍决策的学习和优化。首先 分别利用全连接神经网络和卷积神经网络设计、构建基于图形的顶点取舍模型和基于图像的顶点取舍模型 通过样本训练各模型拟合从图形特征到顶点取舍和从栅格图像到顶点取舍的映射; 然后 基于线性加权、朴素贝叶斯、支持向量机、人工神经网络构建多种融合决策模型 实现基于图形和基于图像的顶点取舍的融合利用; 最后 通过试验用例对所有模型进行测试。试验结果表明: 基于图形和基于图像的顶点取舍模型在一定程度上学习、掌握了化简算子 融合利用后还能进一步提高化简准确性、实现优势互补。 朱丽 刘呈熠 王安东信息工程大学地理空间信息学院 河南 郑州 450001基金项目:国家自然科学基金(41801396);
本文内容来源于《测绘学报》2022年第3期(审图号GS(2022)1460号)
图形、图像融合利用的集成学习智能化简方法及其在岛屿岸线化简中的应用
杜佳威
武芳
朱丽 刘呈熠 王安东
信息工程大学地理空间信息学院 河南 郑州 450001
基金项目:国家自然科学基金(41801396);河南省杰出青年科学基金(212300410014)
摘要:为充分利用已有化简成果及其蕴含的化简知识 本文集成几种机器学习算法提出图形、图像融合利用的智能化简方法 实现顶点取舍决策的学习和优化。首先 分别利用全连接神经网络和卷积神经网络设计、构建基于图形的顶点取舍模型和基于图像的顶点取舍模型 通过样本训练各模型拟合从图形特征到顶点取舍和从栅格图像到顶点取舍的映射; 然后 基于线性加权、朴素贝叶斯、支持向量机、人工神经网络构建多种融合决策模型 实现基于图形和基于图像的顶点取舍的融合利用; 最后 通过试验用例对所有模型进行测试。试验结果表明: 基于图形和基于图像的顶点取舍模型在一定程度上学习、掌握了化简算子 融合利用后还能进一步提高化简准确性、实现优势互补。
关键词:地图综合 化简 机器学习 人工神经网络
引文格式:杜佳威 武芳 朱丽 等. 图形、图像融合利用的集成学习智能化简方法及其在岛屿岸线化简中的应用[J]. 测绘学报,2022,51(3):373-387. DOI: 10.11947/j.AGCS.2022.20210135
DU Jiawei WU Fang ZHU Li et al. An ensemble learning simplification approach based on multiple machine-learning algorithms with the fusion using of raster and vector data and a use case of coastline simplification[J]. Acta Geodaetica et Cartographica Sinica 2022 51(3): 373-387. DOI: 10.11947/j.AGCS.2022.20210135
阅读全文:http://xb.sinomaps.com/article/2022/1001-1595/2022-3-373.htm
引 言
地图综合知识的抽象、获取和运用是实现地图综合自动化、智能化的关键[1]。利用程序语言翻译能够明确表达的综合约束是实现自动综合的经典思路[2]。但是,地图综合还受到制图经验、主观认知、视觉感受等诸多模糊因素[3]影响,综合知识难以全部清晰、准确形式化描述。机器学习技术能够从数据成果中发现模糊知识、辅助综合决策,推动了自动综合智能化升级[4]。化简作为重要综合算子之一[5],基于机器学习的智能化简方法大体分为以下两类:①图形级方法。此类方法将构成图形的顶点作为基本处理单元,从顶点几何特征中抽象出与化简相关的特征项,智能算法通过学习、处理特征项实现压缩顶点的化简目的。文献[6-7]将顶点位置坐标作为特征项,分别利用遗传算法和蚁群模型处理特征项、优化顶点取舍,实现智能化简;文献[8]增加了夹角参数和垂线距离两个特征项,利用自组织神经网络聚类特征项实现顶点聚类和压缩;文献[9]提取了九个影响化简的顶点特征项,利用支持向量机对特征项进行监督学习实现智能化简。②图像级方法。此类方法以矢栅转换为基础、以图像像素为基本处理单元,利用智能算法从图像中学习化简算子。文献[10]利用三层BP神经网络从化简前后的栅格建筑物轮廓中学习、追踪化简轨迹实现化简处理;文献[11]利用卷积自编码器实现栅格建筑物模板匹配,并利用匹配模板化简建筑物轮廓。随着深度学习模型在图像翻译、风格迁移中成功应用[12-13],学习、模拟从化简前到化简后图像变换的思路逐步展开。文献[4]利用U-net学习、模拟从化简前到化简后栅格建筑物轮廓变化;针对蜿蜒、绵长的线要素,文献[14-15]设计了专门的剖分及栅格样本生成方法,分别利用残差Unet、Pix2Pix等深度学习模型模拟从化简前到化简后的图像变换。
利用机器学习方法感知栅格图像、指导化简决策的学习模拟包含了对未被发现且难以形式化描述的模糊化简知识的利用,但受到矢栅转换损失的影响,以像素作为化简处理单元难以保证化简结果的点位准确。化简处理图形顶点能够保持化简结果点位准确,但仅利用可度量特征项学习模拟化简算子,局限于对已知明确化简知识的利用。本文基于集成学习策略[16],通过集成几种机器学习算法,设计能够融合利用图形、图像学习模拟顶点取舍决策的智能化简方法,在确保点位准确的条件下,达到充分利用各种化简知识、优化智能化简效果的目的。
1 图形、图像融合利用的总体方案
集成学习通过构建、结合多个机器学习器完成学习任务[16],以实现“博采众长”。融合利用图形、图像的集成学习化简方法的基本思路为:先分别构建基于图形和基于图像的顶点取舍模型,分别从图形特征层次和栅格图像层次对同一顶点的取舍情况进行学习和预测;再构建融合决策模型对基于图形和基于图像的顶点取舍进行融合利用,得到最终的取舍决策。总体方案如图 1所示。
图 1 图形、图像融合利用的智能化简方法的总体方案Fig. 1 The overall scheme of polyline simplification based on the fusion of using vector and raster data
图选项
为方便后文叙述,将化简前、后的比例尺分别记为S1、S2,供模型训练的化简前、后的要素分别记为la、lb,模型应用中待化简要素记为lc。构成要素的顶点记为vi,la、lb和lc分别表示为la={vi|i∈[1 na]} lb={vi|i∈[1 nb]} lc={vi|i∈[1 nc]}。
2 基于图形的顶点取舍模型
2.1 基于图形的顶点取舍任务
图形是要素的矢量表达形式,适于空间量测、计算和分析。化简离不开对要素局部、整体形态特征的度量,图形几何特征的度量结果能够指导顶点取舍。本文采用18个图形特征项,从邻近顶点关系、弯曲结构和整体形态控制3个层次度量影响顶点取舍的几何特征。其中,基于邻近顶点的图形特征项包含对邻近顶点间距离、角度、垂距、弦长、弧长、面积、垂比弦和弧比弦的度量[9],基于弯曲的图形特征项包含对左、右弯曲的基线长度、深度、面积和结构层次的度量[17],基于整体形态控制的顶点特征项包含对顶点层次和形状控制程度的度量[18-19]。这些指标包含了对局部和整体形态特征的描述,涉及了影响邻近顶点取舍、弯曲取舍和整体形态控制点取舍因素的度量,体现了对顶点取舍已有知识的利用。
基于图形的顶点取舍任务就是利用图形特征确定顶点取舍情况,形式化表示为:[pi1′ pi2′]=GV(FV(vi))。其中,FV表示计算顶点图形特征项,本文中FV(vi)={FV1(vi) … FV18(vi)};GV表示从顶点图形特征项到顶点取舍的映射;[pi1′ pi2′]表示GV基于FV(vi)计算的vi取舍情况,pi1′和pi2′分别表示vi被保留和被删除的概率。
2.2 基于全连接神经网络的顶点取舍模型
全连接神经网络能够利用神经元间的连接关系融合利用多种特征,常用于基于特征项的智能决策[20]。全连接神经网络仅在相邻层神经元间构建连接关系,且每个神经元都与相邻层所有神经元连接。神经元连接参数为权重和偏置,图 2(a)展示了基于权重和偏置的连接计算:xj为上一层神经元的输出值,y为下一层连接神经元的接收值;wj和b分别表示权重和偏置参数;f为激活函数,常采用非线性函数,以拟合复杂非线性任务。
图 2 基于全连接神经网络的顶点取舍模型Fig. 2 The model of vertex selection based on the fully connected neural network
图选项
面向基于图形的顶点取舍任务,设计基于全连接神经网络的顶点取舍模型构建从顶点图形特征项到顶点取舍的映射,如图 2(b)所示。
(1) 输入层含18个神经元,接收计算的18个顶点图形特征项FV1(vi) … FV18(vi)。
(2) 输出层仅含1个神经元,接收计算的顶点取舍结果[pi1′ pi2′],且连接输出层的激活函数为softmax函数[20],确保pi1′ pi2′∈[0 1]且pi1′ pi2′=1。
(3) 输入层和输出层之间可存在若干隐藏层,每个隐藏层内可包含若干神经元,能够利用顶点图形特征项生成多层次特征以指导顶点取舍。
全连接神经网络基于FV(vi)计算[pi1′ pi2′]的过程可描述为:FV1(vi) … FV18(vi)由输入层神经元传递至第1隐藏层,图 2(b)中第1隐层的黄色神经元的接收值为
b),同样地,计算出第1隐层所有神经元的接收值;基于此,计算第2隐层神经元的接收值;依次计算后续各层神经元的接收值,直至得到输出层神经元的接收值,即[pi1′ pi2′]。
2.3 模型参数的求解和优化
神经元间连接的权重和偏置参数是影响模型计算准确性的关键,利用基于图形特征的顶点取舍样本训练模型,自适应求解、优化模型参数,使其适用于基于图形的顶点取舍任务。
构建基于图形特征的顶点取舍样本集。采用三元法记录基于图形特征的顶点取舍样本,即〈顶点,顶点图形特征,取舍情况〉。对于顶点vi,计算图形特征项,记为FV(vi)={FV1(vi) … FV18(vi)};采用独热(One-Hot)编码[21]标记顶点取舍情况,记为[ti1 ti2]∈{[1 0] [0 1]},其中[1 0]表示vi被保留,[0 1]表示vi被删除。对于训练数据la、lb,化简前线要素la各顶点的取舍情况可以通过与化简后线要素lb的匹配关系判定,具体方法参照文献[9]。遍历la各顶点,得到训练样本集{〈vi FV(vi) [ti1 ti2]〉|i∈[1 na]}。
求解、优化模型参数。利用{〈vi FV(vi) [ti1 ti2]〉|i∈[1 na]}训练全连接神经网络,求解适用于本节任务的最优权重和偏置值,具体过程描述为:首先,对权重和偏置随机赋初始值;然后,输入FV(vi)计算输出值[pi1′ pi2′],构建损失函数[20]度量[pi1′ pi2′]到[ti1 ti2]的损失值,利用梯度下降方法[20]自适应调整全连接网络的权重和偏置值以降低损失、逼近真值;遍历训练样本集合并重复ne次,优化模型参数。训练结束后,全连接神经网络参数固定,得到基于图形的顶点取舍模型MV。对任意vi∈la或lc,可执行MV(vi)=GV(FV(vi))=[pi1′ pi2′]。
3 基于图像的顶点取舍模型
3.1 基于图像的顶点取舍任务
图像是要素的栅格表达形式,常作为机器视觉的感知对象。除明确可度量的图形特征外,影响顶点取舍的因素还隐含于制图员对包含顶点上下文环境的主观感受及其引发的难以形式化描述的知识中。在视觉分辨率约束下提取包含顶点在内一定区域的栅格图像,可以看作是人眼感受到的顶点上下文环境;利用机器学习方法从栅格图像中感知顶点取舍是对人眼感受顶点上下文环境指导顶点取舍的模拟,涵盖了对潜在影响顶点取舍模糊知识的利用。
指导顶点取舍判断的栅格图像应满足:①图像像素对应的实际距离小于原始比例尺图上最小可视距离[22]对应的实际距离,保证栅格图像中要素细节足够清晰。即满足pix < svo/S1,其中,pix为每个像素对应的实际距离,svo为图上最小可视距离。②栅格图像应以待判断顶点为焦点且覆盖一定范围,能够充分表达影响顶点取舍的上下文环境。至少,图像覆盖范围应大于目标尺度图上最小可视距离对应的实际距离。即满足pix·npix>svo/S2,其中npix为图像行(列)像素个数。基于①、②,设计对vi提取栅格图像的方法,记为FI(vi),具体如下。
(1) 构建包含vi的待化简要素的外接矩形。
(2) 以vi为中心,构建与外接矩形各边平行且边长为pix·npix的正方形区域。
(3) 利用矢栅转化方法[23]将包含于正方形区域内的矢量要素转换为栅格图像,像素大小为pix,图像尺寸为npix·npix。
基于图像的顶点取舍任务是利用包含顶点上下文环境的栅格图像确定顶点取舍情况,形式化表示为:[pi1″ pi2″]=GI(FI(vi))。其中,GI表示从栅格图像到顶点取舍的映射;[pi1″ pi2″]表示GI基于FI(vi)计算的vi取舍情况,pi1″和pi2″分别表示vi被保留和被删除的概率。
3.2 基于卷积神经网络的顶点取舍模型
卷积神经网络能够利用卷积核和局部感受野从图像中感知多层次特征,常用于基于图像的智能决策[24-26]。卷积是感知栅格图像特征的关键 图像卷积计算方法详见文献[24]。输入图像与卷积核进行卷积运算生成特征图,特征图中的特征值是卷积核对局部感受野感知的结果,如图 3(a)中输入图像红框区域对应特征图红框区域的局部感受野;卷积核规模和步长影响局部感受野的范围和位置,卷积核的权重影响局部感受野的感受结果;具有不同权重、不同规模、不同步长的卷积核能够对局部感受野进行多样感知,得到不同特征图,如图 3(a)中不同权重、不同步长的卷积运算产生了不同的特征图;特征图再次进行卷积运算,可以提取更深层次的特征图、获取多层次感知。此外,池化运算[24-25]能够对一定范围内的特征值进行下采样,实现特征图压缩,得到更加概略的感知结果,如图 3(b)所示。卷积神经网络通过重复布设卷积层和池化层提取、利用多层次特征,如图 3(c)所示。卷积层和池化层的计算过程分别表示为Y=f(Conv(X WJ) BJ)和Y=Sub(X),X和Y分别为卷积层(或池化层)的输入和输出像素值(或特征值)矩阵;f为激活函数;WJ为卷积核权重矩阵;BJ为偏置参数。
图 3 利用卷积、池化感知图像多层次特征Fig. 3 Extraction of multi-level features using convolution and pooling
图选项
面向基于图像的顶点取舍任务,设计基于卷积神经网络的顶点取舍模型构建从栅格图像到顶点取舍的映射,如图 4(a)所示。
图 4 基于卷积神经网络的顶点取舍模型Fig. 4 The model of vertex selection based on the convolutional neural network
图选项
(1) 输入层接收栅格图像FI(vi)的像素值矩阵。
(2) 输出层接收计算的顶点取舍结果[pi1″ pi2″],且连接输出层的激活函数为softmax函数,确保pi1″ pi2″∈[0 1]且pi1″ pi2″=1。
(3) 隐藏层由一个独立卷积层、多个残差块和一个全连接层构成:卷积层用于从输入图像中提取与顶点取舍相关的特征图;残差块用于进一步提取更深层次的特征图,并通过跳跃连接融合利用不同层次的特征图;全连接层利用最后一个残差块生成的特征图的特征值计算顶点取舍情况。其中,卷积层和残差块的结构如图 4(b)所示:卷积层中引入批量标准化(batch normalization,BN)[27]以缓解梯度消失的问题[28],且引入批量标准化还能约减卷积层偏置参数[28],使计算过程简化为Y=f(BN(Conv(X WJ)));残差块可以看作由两个具有跳跃连接的卷积层构成,能够避免神经网络深度增加引发的退化问题[29],残差块计算见式(1)、式(2)
(1)
(2)
式(1)、式(2)分别表示残差块是、否对特征图尺寸进行压缩,式(1)通过调整卷积步长压缩特征图使其与Sub(X)尺寸相同。
卷积神经网络基于FI(vi)计算[pi1″ pi2″]的过程可描述为:输入层接收FI(vi)的像素值矩阵,通过卷积层计算的特征图为f(BN(Conv(FI(vi) W1)))),通过第一残差块计算的特征图为f(Sub(f(BN(Conv(FI(vi) W1))))) BN(Conv(f(BN(Conv(f(BN(Conv(FI(vi) W1)))) W2)))) W3));同样的,依次通过后续残差块计算特征图矩阵;最后一个残差块输出特征图的所有特征值记为{Res(xj)|j∈[1 m]},其通过全连接层计算出顶点取舍情况,即[pi1″ pi2″]=
3.3 模型参数的求解和优化
卷积核权重、全连接层权重和偏置参数是影响模型计算的关键,参照2.3节,利用基于栅格图像的顶点取舍样本训练模型,自适应求解、优化模型参数,使其适用于基于图像的顶点取舍任务。其中,基于栅格图像的顶点取舍样本记录为〈顶点,栅格图像,取舍情况〉。遍历la中顶点,得到训练样本集{〈vi FI(vi) [ti1 ti2]〉|i∈[1 na]};利用此样本集训练卷积神经网络,实现模型参数的求解和优化,具体过程参见2.3。训练结束后,卷积神经网络参数固定,得到基于图像的顶点取舍模型MI。对任意vi∈la或lc,可执行MI(vi)= GI(FI(vi))=[pi1″ pi2″]。
4 图形-图像融合决策模型
融合决策模型旨在融合利用MV(vi)和MI(vi)生成顶点取舍的最终决策。首先,遍历训练样本,执行MV(vi)=[pi1′ pi2′]和MI(vi)=[pi1″ pi2″],得到融合样本集{〈vi [pi1′ pi2′] [pi1″ pi2″] [ti1 ti2]〉|i∈[1 na]};然后,利用不同方法分析融合样本集并构建融合模型Fu(详见4.1~4.4);对S1尺度下任意vi,Fu可实现Fu([pi1′ pi2′] [pi1″ pi2″])=[pi1 pi2],其中pi1和pi2分别表示vi被保留和被删除的概率;最后,利用条件函数式(3)处理[pi1 pi2],得到vi在S2尺度下的取舍决策为
(3)
4.1 线性加权融合模型
线性加权法是实现多指标融合的常用方法[30],MV和MI的输出结果通过线性加权模型实现融合利用,如式(4)所示
(4)
顶点取舍模型越准确,预测的取舍结果越可靠,融合时所占权重越大。因此,MV和MI的权重(即λ′和λ″,且λ′ λ″=1)由两模型精度计算而得,如式(5)所示
(5)
式中,Eva是对模型精度的评价,详见式(6)
(6)
可采用查准率(Precision)、查全率(Recall)、准确率(Accuracy)和F1度量(F1score)等指标评价法。具体而言,就是利用MV(或MI)对训练样本集进行测试,将预测的顶点取舍情况与实际取舍情况进行比较,计算查准率、查全率、准确率和F1度量(计算方法参见文献[31])评价模型精度。
4.2 贝叶斯融合模型
MV和MI模型的输出结果都是顶点取舍概率,基于此,可计算在已知基于图形和基于图像的顶点取舍概率情况下的顶点取舍条件概率,即计算P([ti1 ti2]|MV(vi) MI(vi))。利用朴素贝叶斯方法,对P([ti1 ti2]|MV(vi) MI(vi))进行分解、转化,如式(7)
(7)
式中,pi1′=P([1 0]|MV(vi));pi1″=P([1 0]|MI(vi));pi2′=P([0 1]|MV(vi));pi2″=P([0 1]|MI(vi))。根据大数定律[20],可以利用频率近似逼近概率,即计算顶点被保留和被删除在融合样本集中的频率作为P([1 0])和P([0 1])。结合式(7),可以利用式(8)衡量在已知MV(vi)和MI(vi)的条件下vi被保留和被删除的概率。进一步的,将已知MV(vi)和MI(vi)的条件下概率更大的决策作为融合结果,即由式(8)推导式(9),完成贝叶斯融合模型的构建
(8)
(9)
4.3 支持向量机融合模型
将MV和MI的输出结果作为影响最终取舍决策的支持向量,通过支持向量机分类也可达到融合利用的目的。由于pi1′ pi2′=pi1″ pi2″=1,样本集合{[pi1′ pi2′] [pi1″ pi2″] [ti1 ti2]|i∈[1 na]}可简化为{pi1′ pi1″ [ti1 ti2]|i∈[1 na]};为支持向量机计算方便,令[1 0]=1且[0 1]=-1,样本集合进一步简化为{pi1′ pi1″ labi|labi∈{1 -1} i∈[1 na]}。基于支持向量机的融合决策模型如式(10)所示
(10)
式中,SVM是利用支持向量机学习{pi1′ pi1″ labi|i∈[1 na]}构建的二分类器。
通常情况下,支持向量机通过学习构建能够正确分割支持向量集合的最大间距超平面实现二分类[20]。由于MV和MI采用的样本、神经网络都不相同,两模型输出结果间的关系在低维空间中不易发现。需要利用核函数将支持向量{pi1′ pi1″}映射到更高维空间,记为Ψ(pi1′ pi1″),在高维空间中求解满足式(11)的超平面(即μΨ(pi1′ pi1″) η=0)分割支持向量
(11)
式中,C为惩罚系数;ξ(i)为松弛因子,利用此目标函数能够实现软分类。
软分类使大部分支持向量被正确分类,适用于处理由MV和MI生成的不完全准确的支持向量。将求解的超平面参数μ和η应用于式(12),完成SVM二分类器构建
(12)
4.4 人工神经网络融合模型
将MV和MI的结果作为输入神经元的输入值,利用全连接神经网络实现两模型结果的融合利用。基于{pi1′ pi1″ [ti1 ti2]|i∈[1 na]}设计全连接神经网络构建融合决策模型:由于支撑融合决策的特征项较少,采用3层全连接神经网络结构;输入层包含两个神经元,用于接收pi1′和pi1″;隐藏层层数为1,用于提取与融合决策相关的多元特征;输出层包含一个神经元用于接收顶点取舍决策,且连接输出层的激活函数为softmax函数。利用{pi1′ pi1″ [ti1 ti2]|i∈[1 na]}训练神经网络,求解、优化神经网络参数。训练后的神经网络记为NN,基于NN构建的融合决策模型为
(13)
5 试验用例:化简岛屿岸线
5.1 方法有效性验证
岛屿岸线形态复杂多变,是化简难度最大的要素之一[32],以新西兰Stewart岛屿岸线作为试验对象验证各模型有效性。1∶5万Stewart岛屿岸线包含20 775个顶点,其中前19 104个顶点用于训练,最后1761个顶点用于测试,如图 5(a)所示;采用文献[9]中顶点取舍案例获取方法,从人工综合的1∶25万Stewart岛屿岸线数据中提取顶点取舍结果作为标准化简结果,如图 5(b)所示。基于TensorFlow框架,利用Python语言在GPU RTX 2070s的运算环境下实现本文方法,学习、模拟从1∶5万至1∶25万的顶点取舍决策。
图 5 试验数据Fig. 5 Experimental data
图选项
分别从训练部分和测试部分中提取样本并构建训练集和测试集。提取栅格图像时,令svo=0.2 mm pix=svo/2S1=5 m npix=128;且考虑到文献[15]指出面状图斑比栅格曲线更容易被卷积神经网络学习,从岛屿面域中提取包含顶点上下文环境的栅格图像如图 6所示。
图 6 提取栅格图像的示例Fig. 6 Examples of extracting raster samples
图选项
构建、训练全连接神经网络和卷积神经网络,实现基于图形和图像的顶点取舍。其中,全连接神经网络2个隐藏层的神经元数依次为64和32;卷积神经网络包含1个卷积层、4个残差块和1个全连接层,卷积核大小依次为3×3、8×8、6×6、3×3、3×3,残差块将特征图大小依次压缩为1/4、1/4、1/2、1/2。试验所有神经网络中间层激活函数均为ReLU函数[20],损失函数均为交叉熵函数[20],梯度下降方法均采用Adam方法[33]。全连接神经网络和卷积神经网络训练终止条件分别为ne=20和ne=50,训练过程中对训练集拟合准确率变化如图 7所示。基于训练集和测试集数据评价训练后的MV和MI,统计查准率、查全率、准确率和F1度量,见表 1。由图 7和表 1可知,MV和MI分别一定程度上学习、掌握了岸线化简中的顶点取舍,都具有一定泛化应用能力,且MV优于MI。
图 7 基于图形和基于图像的顶点取舍模型训练过程中训练集准确率的变化Fig. 7 The accuracy changes with training of vector-based and raster-based models
图选项
表 1 利用训练集和测试集对MV和MI的效果评价Tab. 1 Assessments of MV and MI based on training and testing data
(%)
化简模型 |
基于训练集的评价 |
基于测试集的评价 | ||||||
Precision |
Recall |
Accuracy |
F1score |
Precision |
Recall |
Accuracy |
F1score | |
MV |
94.37 |
73.16 |
91.72 |
82.42 |
93.12 |
69.59 |
90.57 |
79.65 |
MI |
56.86 |
83.05 |
78.78 |
67.50 |
40.27 |
64.24 |
65.25 |
49.51 |
表选项
构建以下几个融合决策模型:①分别基于训练集Precision、Recall、Accuracy和F1score构建4个加权融合模型,分别记为PreFu、RecFu、AccFu和F1Fu;②构建一个贝叶斯融合模型,记为BayFu;③构建一个采用高斯核函数、惩罚系数为0.01的支持向量机融合模型,记为SVMFu;④构建一个隐藏层包含32个神经元的全连接神经网络,由该神经网络对训练集数据重复学习10次训练而得的融合模型记为NNFu。利用融合模型处理训练集和测试集,计算查准率、查全率、准确率和F1度量评价顶点取舍效果,如表 2所示。由于F1score是对Precision和Recall的加权平均,着重基于Accuracy和F1score分析各融合模型效果。
表 2 利用训练集和测试集对融合模型效果的评价Tab. 2 Assessments of fusion models based on training and testing data
(%)
融合模型 |
基于训练集的评价 |
基于测试集的评价 | ||||||
Precision |
Recall |
Accuracy |
F1score |
Precision |
Recall |
Accuracy |
F1score | |
PreFu |
94.75 |
77.56 |
92.91 |
85.30 |
91.92 |
70.66 |
90.57 |
79.90 |
RecFu |
60.01 |
90.55 |
81.48 |
72.18 |
48.36 |
82.23 |
72.00 |
60.90 |
AccFu |
60.68 |
91.12 |
81.98 |
72.85 |
49.74 |
83.09 |
73.25 |
62.23 |
F-1Fu |
66.92 |
88.89 |
85.39 |
76.35 |
58.35 |
81.58 |
79.67 |
68.04 |
BayFu |
82.78 |
80.48 |
90.38 |
81.61 |
76.47 |
72.38 |
86.77 |
74.37 |
SVMFu |
94.27 |
76.91 |
92.63 |
84.71 |
92.31 |
71.95 |
90.97 |
80.87 |
NNFu |
92.15 |
85.21 |
94.15 |
88.54 |
88.60 |
79.87 |
91.94 |
84.01 |
表选项
(1) 所有融合模型都实现了对图形决策和图像决策的集成,使融合前效果相对较差的模型得到显著提升。表 2中所有融合模型的Accuracy和F1score值高于表 1中融合前MI模型的Accuracy和F1score值,融合模型使MI精度得到提升。但是,融合模型的Accuracy和F1score值不都高于融合前的MV模型,部分融合模型使MV精度受损。
(2) RecFu、AccFu、F1Fu和BayFu没有起到融合利用MV和MI结果、提升顶点取舍精度的效果。对于训练集,RecFu、AccFu、F1Fu和BayFu的Accuracy和F1score值低于MV。这些模型属于加权融合模型或贝叶斯融合模型,是在一定假设基础上构建的融合模型。其中,加权融合模型假设MV与MI输出结果间存在线性关系,贝叶斯融合模型中假设概率可以被频率近似。这些固定假设影响了模型应用的灵活性和适应性,导致融合效果不佳、准确率损失等问题。
(3) PreFu、SVMFu和NNFu起到了提升顶点取舍精度的效果,实现了图形和图像决策的融合利用。对于训练集和测试集,PreFu、SVMFu和NNFu的Accuracy和F1score值高于MV和MI。这些融合模型大都以机器学习为基础,支持向量机和人工神经网络能够从融合数据集中发现规律、指导融合应用,用于关系脆弱且不明确的MV和MI结果数据融合时,具有更好的灵活性和适应性。
对PreFu、SVMFu和NNFu的化简效果展开进一步分析。
(1) 从顶点取舍的准确性看,无论是基于训练集还是测试集,表 2中NNFu的Accuracy和F1score值都高于PreFu和SVMFu,神经网络更好的灵活性和适应性使NNFu的顶点取舍精度高于SVMFu和PreFu。
(2) 从化简结果的视觉感受上看,PreFu、SVMFu和NNFu都能融合利用MV和MI,在一定程度上起到了优势互补的效果。部分测试弧段的化简效果如图 8所示:对于区域1内的弧段,MV的化简结果与目标化简结果更加一致;对于区域2内的弧段,MI的化简结果与目标化简结果更加一致;NNFu化简区域1的结果与MV相似,化简区域2的结果与MI相似,体现了对MI和MV融合利用和优势互补;SVMFu化简区域2的结果与MI相似,化简区域1的结果略逊于MV的化简结果、但明显优于MI的化简结果,在一定程度上体现了对MV和MI的融合利用;PreFu化简区域1和区域2的结果与MV相似,仅使区域1和区域2间弧段的化简效果得到改善,表现出对MV的严重依赖和对MI的利用不足。
图 8 部分测试弧段的化简结果(蓝色和红色曲线分别表示原始岸线和化简结果)Fig. 8 Simplified results of part of test data with different models (the original coastlines and simplified coastlines are colored by bule and red respectively)
图选项
(3) 计算Hausdorff距离[34]、面积差[35]、符号重叠率[36]、视觉缓冲区限差[15 34]度量模型化简结果与标准化简结果间的相似性(表 3),量化评价各模型的整体化简效果。其中,Hausdorff距离、面积差越小,模型化简结果与标准化简结果越相似;符号重叠率、视觉缓冲区限差越大,模型化简结果与标准结果越相似,符号重叠率的线宽设置为0.1 mm,视觉缓冲区限差的最小可分辨距离设置为0.2 mm。从符号重叠率上看,PreFu和MV相差不大,但从Hausdorff距离、面积差和视觉缓冲区限差上看,PreFu生成的化简结果没有比MV更接近于标准化简结果,融合效果并不理想;从所有指标上看,SVMFu和NNFu生成的化简结果与标准化简结果的相似性都高于MV和MI,融合效果良好;且NNFu的化简结果与标准化简结果具有最高的相似性,做到了相对最优的融合利用。
表 3 测试弧段化简结果与标准化简结果的相似性评价Tab. 3 Evaluation of similarities between automated results and target results for the testing data
模型 |
Hausdorff距离/m |
面积差/m2 |
符号重叠率/(%) |
视觉缓冲区限差/(%) |
MI |
444.86 |
748 972.00 |
62.16 |
88.40 |
MV |
423.22 |
365 340.14 |
79.23 |
95.04 |
PreFu |
495.49 |
392 654.14 |
79.61 |
93.76 |
SVMFu |
423.22 |
329 251.06 |
81.55 |
95.45 |
NNFu |
423.22 |
274 128.70 |
85.31 |
95.71 |
表选项
类似地,利用本文方法进行多尺度化简试验,并计算测试部分海岸线由1∶5万化简至1∶25万、1∶50万、1∶75万和1∶100万时线要素化简前后的顶点压缩率[9]、长度比[15]、Hausdorff距离、面积差和平均曲率相似度[37],见表 4。本文方法能够进行多尺度化简,且比例尺跨度越大、化简结果越概略,符合多尺度变化的客观规律;各尺度化简结果与原始线要素的曲折程度一致性较高,保持了良好的几何相似性。
表 4 测试部分海岸线多尺度化简结果的评价Tab. 4 Evaluations of multi-scale simplifications of the testing coastline
化简后的比例尺 |
顶点压缩率/(%) |
长度比/(%) |
Hausdorff距离/m |
面积差/m2 |
平均曲率相似度/(%) |
1∶25万 |
76.09 |
97.03 |
376.49 |
457 109.97 |
88.27 |
1∶50万 |
89.49 |
92.12 |
520.88 |
1 134 359.48 |
85.41 |
1∶75万 |
95.40 |
84.46 |
922.75 |
3 061 365.23 |
84.52 |
1∶100万 |
98.35 |
70.62 |
2197.25 |
9 120 613.76 |
88.27 |
表选项
5.2 方法优越性验证
令融合效果最好的NNFu模型与以下化简方法进行对比,验证本文方法的优越性。
5.2.1 与其他智能化简方法的对比分析
文献[9]是近些年具有代表性的智能化简方法,但其采用的特征项不及本文采用的18种顶点特征项丰富、全面。为增强两方法的可比性、控制对比试验变量,对比方法1采用文献[9]方法并将其特征项扩展至与本方法相同。利用训练部分岸线对方法1进行训练,过程如图 9所示,迭代至5500次时方法1的准确率和F1度量都相对较高,利用此时的模型对测试部分进行化简,化简结果的量化评估如表 5所示。
图 9 方法1在训练过程中模型准确率和F1score的变化Fig. 9 The accuracy andF1score changes with training of the comparison method 1
图选项
表 5 方法1对测试部分海岸线化简效果的评价Tab. 5 Evaluation of the contrast method simplification for the testing data
Precision /(%) |
Recall /(%) |
Accuracy /(%) |
F1score /(%) |
Hausdorff距离 /m |
面积差 /m2 |
符号重叠率 /(%) |
视觉缓冲区限差 /(%) |
44.00 |
56.53 |
69.36 |
49.48 |
479.26 |
1 339 737.28 |
56.15 |
77.97 |
表选项
比较表 1—3与表 5发现:方法1对训练集的学习效果和测试集的预测效果都没有达到NNFu模型的效果,甚至逊于融合前的MV模型。这是因为方法1采用的支持向量机模型的学习能力通常被认为弱于MV模型采用的多层全连接神经网络,其难以充分学习掌握岸线顶点取舍这一相对复杂任务;此外,方法1只顾及了可度量的图形特征,而NNFu模型还融合了隐含于图像中的模糊知识。综上所述,本文方法优于方法1。
5.2.2 与其他自动化简方法的对比分析
文献[32 35 38-39]是近些年具有代表性的自动化简方法。其中,文献[35 39]是基于顶点的化简方法,文献[32 38]是基于弯曲的化简方法,都可用于岸线化简。文献[35 39]方法记为方法2和方法3,都参照文献[35]控制两方法的化简参数,使化简结果与标准化简结果的顶点数相同;文献[38]记为方法4,弯曲化简的宽度阈值和深度阈值设置为0.3 mm和0.5 mm;文献[32]记为方法5。利用方法2—5化简测试部分岸线,化简结果量化评价如表 6所示。
表 6 方法2—5化简结果与标准化简结果的相似性评价Tab. 6 Evaluation of similarities between automated results of contrast methods 2—5 and target results
化简方法 |
Hausdorff距离/m |
面积差/m2 |
符号重叠率/(%) |
视觉缓冲区限差/(%) |
方法2 |
431.37 |
418 361.425 |
78.09 |
96.76 |
方法3 |
382.44 |
603 750.535 |
62.34 |
92.61 |
方法4 |
445.49 |
787 903.718 |
65.65 |
87.56 |
方法5 |
280.90 |
959 079.662 |
54.34 |
82.37 |
表选项
分析表 6与表 3可以发现:方法2顾及了化简前后的面积保持,面积差、符号重叠率、视觉缓冲区限差都优于方法3—方法5,与标准化简结果具有很好的整体相似性,但除视觉缓冲区限差外,面积差、符号重叠率都没有达到NNFu的水平,且严格保证化简前后面积相等会导致局部变形较大,表现为Hausdorff距离相对最大;方法3化简结果与标准化简结果的整体相似性逊于NNFu,但方法3在压缩顶点的同时允许在可视范围内移动顶点,使表征局部相似性的Hausdorff距离优于NNFu;方法4—5化简结果与标准化简结果的整体相似更差,这是由于弯曲比顶点的处理粒度更粗,容易产生更大的变形;特别是方法5面向海图应用,以单侧弯曲化简为主,与标准化简结果的整体相似最弱。这些自动化简方法往往只顾及有限约束,且只在约束范围内效果良好,表现为方法2—5化简结果的量化评价中可能存在1个指标优于NNFu的化简结果;而实际地图综合中化简约束往往是多元混合的,本文方法从数据成果中学习化简决策,更具优越性和适应性,表现为方法2—5优于NNFu的量化评价指标最多不超过1个。
进一步验证本文方法的优越性与适应性,扩充测试数据并与具有广泛适用性的化简方法3、4进行对比试验:利用NNFu化简新西兰南岛的4段岸线(表 7),计算化简后的顶点压缩率[9]、弯曲压缩率[38];利用方法3化简岸线1—4至与NNFu相同的顶点压缩率,各化简结果的位置误差[40]如表 8所示;利用方法4重复删除细小弯曲,直至化简后岸线1—4的弯曲压缩率恰好不大于NNFu化简结果为止,各化简结果的位置误差见表 9。
表 7 其他1∶5万的海岸线数据Tab. 7 Some other coastlines to be simplified
数据详情 |
岸线1 |
岸线2 |
岸线3 |
岸线4 |
示意图 (非原始尺度) | ||||
描述 |
Open Cove 至Pickersgill Harbour |
Titoki Bay 至Whites Bay |
Landing Bay 至Kisbee Bay |
Pegasus Bay 至Birdlings Flat |
长度/km |
559.55 |
195.22 |
249.52 |
421.77 |
表选项
表 8 方法3和NNFu化简效果的比较Tab. 8 Comparisons on different simplifications with same vertex compression ratio
数据 |
方法 |
位置误差/m |
顶点压缩率/(%) |
岸线1 |
NNFu |
5.84 |
76.93 |
方法3 |
9.41 |
76.93 | |
岸线2 |
NNFu |
2.77 |
58.80 |
方法3 |
5.52 |
58.80 | |
岸线3 |
NNFu |
3.63 |
69.19 |
方法3 |
5.95 |
69.19 | |
岸线4 |
NNFu |
4.80 |
73.40 |
方法3 |
7.54 |
73.40 |
表选项
表 9 方法4和NNFu化简效果的比较Tab. 9 Comparisons on different simplifications with similar bend compression ratio
数据 |
方法 |
位置误差/m |
弯曲压缩率/(%) |
岸线1 |
NNFu |
5.84 |
72.18 |
方法4 |
9.75 |
66.38 | |
岸线2 |
NNFu |
2.77 |
47.29 |
方法4 |
5.60 |
41.10 | |
岸线3 |
NNFu |
3.63 |
58.45 |
方法4 |
4.32 |
44.47 | |
岸线4 |
NNFu |
4.80 |
66.88 |
方法4 |
8.25 |
65.66 |
表选项
分析表 8、表 9可知:在相同的顶点压缩率下,NNFu化简岸线1—4的位置误差比方法3更小;在相似的弯曲压缩率下,本文方法较方法4能够压缩更多的弯曲且产生更小的位置误差,本文方法更好地保持了化简前后的整体相似性。此外,在保持不同海岸地理特征上,本文方法也具有一定优势。图 10(a)中,本文方法更好地保持了人工岸线规则平直的特征,方法3、4对其中海岸人工建筑[41](虚线框内)的不良化简破坏了其原本地理意义;图 10(b)中,本文方法更好地保持了海湾的整体形态及湾口位置的准确性(虚线框内),确保了对化简前、后海湾地理特征认识的一致性;图 10(c)中,本文方法较方法4更好地化简了狭长河口(虚线框内),较方法3更好地保持了曲折部分与平滑部分的差异性。综上所述,进一步证实了本文方法的优越性和适应性。
图 10 不同类型海岸线化简效果的比较(蓝色曲线为原始岸线、红色曲线为化简结果)Fig. 10 Comparison of different simplifications of various coasts: the original coastlines and simplified coastlines are colored by bule and red respectively
图选项
6 结论
本文集成几种机器学习算法学习、模拟、优化化简过程中的顶点取舍决策:利用全连接神经网络构建了基于图形的顶点取舍模型,利用卷积神经网络构建了基于图像的顶点取舍模型,利用线性加权、贝叶斯理论、支持向量机、全连接神经网络建立了能够综合利用基于图形和基于图像的顶点取舍的诸多融合决策模型,实现了融合利用图形和图像中蕴含的化简知识学习模拟顶点取舍的智能化简,起到了顶点取舍优化、化简精度提高、不同模型优势互补的良好效果。
在实际应用中,不是所有融合决策模型都发挥了良好效果,如何选择、衡量、解释融合决策模型还需进一步研究;此外,向智能化简模型中引入明确的地图综合知识以增强智能方法可解释性和约束性,也是十分重要研究。特别的,本文提出的图形、图像融合利用的思路还能用于指导模式识别、数据增强和其他综合算子中智能方法(如文献[4 25-26 42])的优化升级。沿着多特征融合利用的集成学习思路,融合语义特征、三维特征等更加丰富的特征项,集成图卷积神经网络[42]、生成对抗网络[15]等更加多元的机器学习算法,都值得进一步探索。
作者简介
第一作者简介:杜佳威(1992—) 男 博士生 研究方向为自动地图综合、空间数据智能处理等。E-mail: whdxdjw@126.com
通信作者:武芳 E-mail: wufang_630@126.com
初审:张艳玲
复审:宋启凡
终审:金 君
往期推荐
资讯
○ 东华理工大学发布优秀人才招聘通知!
○ 《测绘学报(英文版)》被中国科学引文数据库CSCD收录
○ 贵州省第二测绘院2022年公开招聘(地信、测绘遥感等相关专业)
○ 自然资源部国土卫星遥感应用中心正式对外发布卫星激光测高产品
○ 要闻 | 修订后的《地名管理条例》公布,5月1日起施行
○ 中国地质大学康志忠教授荣获国际摄影测量与遥感学会主席荣誉奖
○ 刚刚!自然资源部印发技术文件,扎实推进新型基础测绘与实景三维中国建设工作
○《测绘学报》青年科学家沙龙(第1辑)报告日程
会议
○ 关于举办《测绘学报》青年科学家沙龙(第1辑)的通知
○ “第二届新型基础测绘高峰论坛”会议日程来啦!
○ 第二届“地理资源青年创新论坛”一号通知
○ Geoinformatics 2022 暨CPGIS成立30周年年会(二号通知)
《测绘学报》
○《测绘学报》同济专刊 | 龚健雅:智能遥感深度学习框架与模型设计
○ 测绘学报 | 王乐洋:协方差阵非负约束的赫尔默特方差分量估计
○《测绘学报》同济专刊(2022年第4期)目录
○ 测绘学报 | 毛文婧:基于深度学习的中国连续空间覆盖PM2.5浓度预报
《测绘通报》
○ 《测绘通报》2022年第3期目录
○ 《测绘通报》2022年第2期目录
○ 地市级实景三维城市建设及应用
○ 基于GIS的东川区生态环境敏感性分析
《北京测绘》
○《北京测绘》2022年第2期摘要推荐
○《北京测绘》2022年第1期摘要推荐
○《北京测绘》2021年第12期摘要推荐
○《北京测绘》2021年第11期摘要推荐
《测绘科学技术学报》
○ 摘要 |《测绘科学技术学报》2021年第2期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第4期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第5期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第6期摘要推荐
《地球信息科学学报》
○ 《地球信息科学学报》2022年第4期佳文推介
○ 龚健雅院士:全球位置信息叠加协议与位置服务网技术研究进展与展望
○ 专题征稿:地球信息科学技术在旅游休闲领域的应用
○ 专刊征稿:社会感知与地理大数据挖掘(征稿中)
《测绘工程》
○ 摘要 |《测绘工程》2022年第2期摘要推荐
○ 摘要 |《测绘工程》2022年第1期摘要推荐
○ 摘要 |《测绘工程》2021年第6期摘要推荐
○ 佳文推介 | 单目视觉技术在室内定位中的应用研究
《中国空间科学技术》
○《中国空间科学技术》2022年第2期摘要
○《中国空间科学技术》2022年第1期摘要
○《中国空间科学技术》2021年第6期摘要
○《中国空间科学技术》第四届编委会第二次全体会议顺利召开
《卫星应用》
○《卫星应用》2022年第02期摘要○《卫星应用》2022年第01期摘要○《卫星应用》2021年第12期摘要○《卫星应用》2021年第11期摘要《Journal of Geodesy and Geoinformation Science》
○ 《测绘学报(英文版)》被中国科学引文数据库CSCD收录
○《测绘学报(英文版)》专刊征稿 | 地图学与地球空间信息教育:理论与实践
○ 《测绘学报(英文版)》专刊征稿 | 用于三维地理信息的摄影测量和计算机视觉
○ InSAR专刊 | 《测绘学报(英文版)》(JGGS)2022年第1期发布
○ GFZ德国地球科学研究中心-贺玉芳 | 《测绘学报(英文版)》(JGGS)InSAR专刊
○ 长安大学-朱武教授 | 《测绘学报(英文版)》(JGGS)InSAR专刊
《Satellite Navigation》
○ 杨飞博士:GNSS天顶对流层精化模型的构建与分析| SANA佳文速递
○ 2022征文| SatNav“普适定位、室内导航与基于位置服务”专题
○ 2022征文| SatNav“GNSS地学应用”专题
○ 李昕博士:多频多星座PPP-RTK原理及性能| SANA佳文速递
《自然资源遥感》
○ 摘要 |《自然资源遥感》2022年第1期摘要推荐
○ 《自然资源遥感》征稿:“海岸带空间资源及生态健康遥感监测”专栏
○ 摘要 |《自然资源遥感》2021年第3期摘要推荐
○ 摘要 |《自然资源遥感》2021年第4期摘要推荐
《Journal of Geovisualization and Spatial Analysis》
○《Journal of Geovisualization and Spatial Analysis》入驻“智绘科服”融媒体平台!
○ JGSA国际期刊2021年第5卷第2期论文摘要
○ 高被引论文推荐 | Journal of Geovisualization and Spatial Analysis
○ JGSA论文推荐 | 地理信息科学研究在过去几十年中都在关注什么?
《全球定位系统》
○《全球定位系统》入驻“智绘科服”融媒体平台!
○《全球定位系统》入选《世界期刊影响力指数(WJCI)报告(2021科技版)》
○《全球定位系统》2022年第1期目次
○《全球定位系统》2022年“卫星导航与增强”专栏征文
《导航定位与授时》
○《导航定位与授时》入驻“智绘科服”融媒体平台!
○《导航定位与授时》首次被日本科学技术振兴机构数据库(JST) 收录