CARAFE:基于内容感知的特征(FEatures)重新组装

日期: 2025-09-30 10:11:01|浏览: 3|编号: 144581

友情提醒:信息内容由网友发布,本站并不对内容真实性负责,请自鉴内容真实性。

摘要

特征增强是众多当代卷积网络体系(比如特征塔)中的核心环节。其构思对于目标定位以及语义/物体分割这类密集预测工作具有决定性作用。我们在这篇文章中倡导了一种名为内容导向特征整合的技术,它是一种通用性强、计算量小且效能极高的方法,旨在达成上述目的。该方法具备诸多显著优点:首先,它能够提供全局性视野。不同于以往仅借助子像素邻近区域进行信息提取的研究(比如双线性方法),本方法能够在大范围感受野中整合上下文细节,并且,在处理图像内容时,与对所有数据应用统一卷积核(例如反卷积层)的做法不同,本方案能够针对特定实例进行内容感知操作,即时构建并应用自适应卷积核,此外,该方案的计算负担非常轻微,并且能够便捷地融入当前流行的网络模型架构之中。我们针对目标识别、物体/场景划分以及照片补全的权威测试平台实施了全面检测。在各项挑战里均获得稳定且突出的改进效果(具体数值为、),同时运算负担极小。这种技术极有可能成为后续探索的重要基础。程序与架构资料可以索取。

1. 引言

特征增强是深度网络里基础环节之一。在处理密集预测工作(比如超分辨率、图像补全和语义划分)时,解码器需要对高阶/低阶特征图进行放大,以便同高分辨率目标对齐另有一面,特征上采样还包含将高级别/低清晰度特征图与低级别/高清晰度特征图合并的操作,这种做法在众多顶尖架构中得到普遍运用,比如特征金字塔网络、U-Net以及堆叠沙漏网络。所以,如何设计出高效的特征上采样运算,变成了一个核心课题。

首选的上采样方法包括最近邻法和双线性方法,这两种技术借助像素间的空间间隔来引导提升过程。不过,最近邻法和双线性方法仅关注局部像素范围,难以获取密集预测任务所需的充足语义内涵。另有一种自适应提升技术称作反卷积。反卷积层作为卷积层的逆向操作,能够习得一套与特定实例无关的提升滤波器。但该技术存在两个显著局限。反卷积算子对整个图像实施一致的滤波核,而不管内部结构如何。这种做法削弱了它捕捉局部差异的功能。此外,选用宽核会导致参数数量激增,并带来繁重的运算负担。这种高成本限制了算子处理大范围区域的能力,进而影响了它的表现力和实际效果。

本文突破上述局限,探索一种特征上采样方法,该方法具备三个核心优势,分别是,一,能够在宽广的感受野范围中整合信息,二,能够针对不同样本内容进行即时调整,三,能够维持运算的高效性,基于此,我们设计了一种兼具精简与高效特点的方法,命名为内容感知特征重组详细来说,运用加权混合方法,围绕各个点设定的特定范围内重新配置特征,其权重依据内容感知机制确定。不仅如此,针对每个点,存在若干组此类上采样权重。特征提升过程,是将所得特征重新排列成空间单元来实现的。

这些空间自适应权重并非作为网络参数进行学习,而是借助激活状态的轻量级全卷积模块即时预测得出。图1展示了其运作原理。经过上采样处理,特征图能更精确地刻画目标轮廓,进而帮助模型得到更优的实例分割效果。我们的方法不仅对特征图实施空间维度提升,同时致力于强化其区分度。

为验证其普适性,我们借助通用框架,在多种密集预测场景中实施整体测试,涵盖目标识别、物件划分、场景分割及图像复原。在MS COCO 2018 test-dev数据集中,该方法有助于RCNN提升目标识别能力,同样能增强Mask RCNN的物件划分效果。语义分割任务在验证集上表现更佳,图像修复任务在验证集上PSNR值增加了1.1 dB。当256通道特征图进行倍数放大时,新方法的计算负担很小,仅为 FLOPs,而反卷积的计算负担则大得多,为 FLOPs。各项任务中的明显进步证明,该算子是一种既实用又快捷的特征提升方法,将来极有可能发展成为重要的学术基础。

2. 相关工作

上采样技术,常见方法包括最近邻映射和双线性映射,这些映射技术通过距离确定像素关联,并采用预设的映射模板。随着深度学习的发展,出现了多种运用可训练算子对映射特征图的技术,其中反卷积作为卷积的逆向操作,是这类可训练映射器中最为突出的代表。Pixel 提出了一种另类的放大方案,它把通道维度上的深度信息重新排列成空间维度上的宽和高。紧接着,研究者们又提出了引导放大技术,这种方案通过选取带有可训练偏移量的像素点完成插值工作。不过这些方案都存在局限,前者仅仅考虑了邻近区域内的信息关联,后者则要付出高昂的运算代价来执行自适应放大。超分辨率和去噪方面,其他研究也尝试了在初级视觉任务里运用可训练的核函数,本文秉持相近的构思,阐述了内容识别特征重组在多项视觉感知任务中进行升采样的实际效果和运作原理,同时给出了一种构造简单的办法。

密集识别工作。物体搜寻是划定带有框框的物件的工作,范例划分再要求估算范例级别的遮盖物。-RCNN把区域提议网路(RPN)加进去了用于从头到尾训练,这个网路通过辅助框框方案获得了加强。

21, 24, 17, 45, 31

借助多层级特征堆叠来应对形态各异的物体,通过增设专门的区域划分子网络,Mask-RCNN及其衍生版本取得了理想的精细级标注成效,精细级标注需要对指定图像执行像素层面的语义判断,运用了多种尺寸的网格空间整合,并据此构建了一个功能更全面的体系,对照片或动态影像进行破损区域复原

42, 40, 39

图像中空白部分的处理是一个常见难题,U-net方法近期备受关注,它运用了多种放大技术,Liu团队提出了局部卷积单元,旨在降低空白部分对卷积单元的作用,我们在众多密集预测领域验证了该方法的广泛适用性。

3. 内容感知特征重组

特征增强是当前诸多卷积网络设计中的核心环节,这些网络旨在处理目标识别、物件划分以及环境理解等应用。本次研究,我们设计了一种基于内容感知的细节重构方法,用以提升特征矩阵的分辨率。具体实施时,依据局部数据特征,可以推算出相应的调整矩阵,同时,在预先设定的邻域范围内,对细节信息进行整合与优化。依靠信息内容优势,能够在多处位置应用可调节且经过改进的重组核,并且比当前普遍的上采样方法(例如插值或反卷积)获得更优的效果。

3.1. 公式化

这个重组操作由两部分组成,首先针对每个目标位置,依据内容生成一个重组核,其次利用生成的核对特征进行重新配置。输入的特征图尺寸和指定的放大倍数,会决定输出特征图的最终尺寸。输出特征图的每一个目标点,都对应着输入特征图上的一个源点,满足特定映射关系。在此,我们称作以地点为基准、面积为的片段,也就是的邻近范围。

在初始阶段,核心推测单元针对各处所生成一个位置关联核,其依据为公式编号一。接着进行整合处理,依据公式编号二,内容关联整合单元会借助这些核来重新构建邻近区域。

在以下部分中,我们将详细说明和的细节。

3.2. 核预测模块

核预测单元通过理解材料特性来创建新的核结构,每一个源点都关联着对应的终点,每个终点都需要一个特定尺寸的核,这个尺寸就是核的体积,所以这个单元最终会生成体积为的核,这个体积值就是。

核预测单元包含三个部分,分别是通道压缩单元、信息编码单元和核标准化单元,如图2所示。通道压缩单元会降低输入特征图的通道数量。接下来,信息编码单元将压缩后的特征图作为数据来源,执行编码操作以形成新的核结构。最后,核标准化单元会对每一个新核实施特定的运算。下面将分别阐述这三个部分的功能细节。

通道压缩器,我们运用一个卷积层,将输入特征通道进行缩减,降至更少数量。降低输入特征图的通道数,能够减少后续环节中的参数总量和运算开销,从而提升效率。在预算相同时,还可以选用更大的内核尺寸,用于对内容编码器进行处理。实验显示,在可接受的幅度内压缩特征通道,不会对性能造成负面影响。

内容编码器采用特定尺寸的卷积单元,依据输入数据的特征构造出重组核心。编码单元的参数设定为若干值。从直观角度分析,增大单元尺寸能够扩展编码器的感知范围,从而借助更广阔区域内的关联信息,这对重组核心的推算至关重要。不过,计算任务量会随单元尺寸的平方关系提升,而由此带来的效果提升却不成比例。根据5.3节的研究成果,经验公式在性能表现和效率提升方面达到了理想的平衡状态。

核归一化装置,在用于处理输入特征图时,每个重组核都要经过特定运算实现空间上的标准化处理,标准化过程确保所有核值的总和恒等于1,这种做法属于局部范围内的柔化挑选方式,核归一化装置不会进行任何重新调整以改变特征图的平均数值,正因如此我们设计的这个操作被称为特征重组技术

3.3. 内容感知重组模块

借助每一个重组核,内容感知重组模块会借助函数把局部范围内的特征再次组合。我们采用的是一种简化的方式,它本质上是一个加权求和运算。针对目标位置及其周围的正方形区域,重组过程遵循公式(3),具体表现为:

重组核后,区域里每个像素点,会根据特征内容而非位置远近,对上采样像素作出不同贡献,局部相关点的信息,会得到更多关注,因此,重新组合后的特征图,语义信息,可能比原始特征图,更为丰富。

3.4. 与先前算子的关系

在此,我们探讨了动态滤波器、空间注意力、空间变换器以及可变形卷积之间的联系,这些技术拥有相近的构思方式,不过各自的关注点有所区别。

动态滤波器能够依据网络接收的信号,创建对应特定样本的卷积模板,接着将计算出的模板作用于信号上。这类滤波器属于内容识别模块,其核心差异体现在核心模板的产生方式上。具体而言,动态滤波器包含两个连续的卷积阶段,这两个阶段需要消耗较多的计算资源,其中一个阶段用于预测模板,另一个阶段用于应用模板。与此不同,仅对局部区域内的特征进行重新配置,并不去掌握不同通道间的特征转换方式。设想输入特征图的通道数量是某个值,滤波器的内核尺度是另一个值,那么在动态滤波器的设计里,每个位置预测的内核参数都是独特的。当通道数量较少时,内核参数就会变得简单。这样一来,它在存储空间和运算速度方面的表现更为出色。

空间注意力首先生成一个与输入特征尺寸相等的注意力分布图,接着对每个位置的特征图实施调整比例。该机制运用加权求和方式,将邻近区域内的特征进行整合。总而言之,空间注意力本质上是一种逐点进行比例调整的运算,同时它也是一种基于局部范围进行特征合并的处理方式。空间注意力可以视为一种特殊情形,当重组核的尺寸设定为1时,且不涉及核归一化器,便会出现这种情形。

空间变换网络是一种技术,它依据输入的特征图来预测一个全局的参数变换,然后利用这个变换对特征进行变形处理。不过,这种全局参数变换的假设过于严格,难以展现复杂的空间变化情况;同时,STN的训练过程也相当困难。针对这些问题,我们采用了位置特定的重组方法来处理空间中的相互关系,这种方法能够实现更为灵活的局部几何建模。

可变形卷积网络,这种网络运用了学习几何变换的理念,同时融合了标准卷积层。它通过预测内核位移量来工作,而不是依赖网格卷积内核。像动态滤波器一样,它也是一个可重配置的算子,其运算开销比常规算子高二十四倍。此外,该网络对于参数的初始设定也非常依赖。

4. 的应用

能够直接嵌入到那些依赖上采样模块的既有体系中,我们在此列举了它对于一些核心密集预测课题的实际运用,借助极小量的冗余变量补充,无论在高层或底层挑战(诸如目标捕捉、物件划分、场景辨识以及画面重制)上都强化了当前最优技术的表现水准

4.1. 目标检测和实例分割

特征金字塔网络属于目标检测和实例分割范畴,是一种关键且高效的模型设计。该架构能够大幅提升 R-CNN与Mask R-CNN等主流方法的工作成效。它借助自上而下的通路以及横向的衔接方式,成功构建了兼具丰富语义信息的能力强大的特征层级结构在自上而下的流程里,先运用邻近点估算方法,把低清晰度的特征图尺寸放大一倍,接着将它和高清晰度的特征图合并,具体效果见图3。

我们建议在各个特征层级上采用替代最近邻进行插值,这种调整非常平滑,且无需其他改动。除了FPN结构,Mask R-CNN在掩码输出的最后加入了一个转置卷积层。该层用于将预测的数值进行上采样,以便得到更精密的掩码结果。我们同样能够用其他方式替代转置卷积层,以此来进一步减少计算开销。

4.2. 语义分割

语义分割任务需要模型针对整幅图像进行逐点的预测,所以通常倾向于使用高清晰度的特征图。在这个任务里,提升分辨率的技术被普遍用于扩大特征图,并且整合不同层级的语义信息。这种技术是语义分割领域的一个有效基准。它在PPM、FPN、FUSE这三种架构中都应用了提升分辨率的方法。我们选择用其他方式来替代它们原本使用的提升分辨率模块。

金字塔池化结构是核心构成,它将输入的特征图逐层缩小到不同尺寸,再借助双线性方法将它们扩大至原始大小。接着,把处理后的特征与原始特征合并。鉴于扩大的倍数很高,我们采用分两步进行的方法,力求在效果和速度之间找到最佳结合点。我们先将特征通过双线性插值方法提升至原始特征图尺寸的一半,接着再运用另一种方法将其尺寸扩大两倍。

特征金字塔网络。这种网络结构,也运用特征金字塔来增强特征的信息量。它总共设置了四个特征层级,各个层级的间距不同。我们按照4.1节所用的方法,更换了其中的上采样模块。

多级特征融合模块在FPN之后被引入,它运用双线性插值方法,将P3、P4、P5三个层级上的特征图进行放大,使其尺寸与P2保持一致。接着,通过特征拼接的方式,将这些不同层级的特征图进行融合。这一过程可以看作是逐步上采样和拼接的序列操作,具体步骤为:首先将P5上采样至P4的尺寸,并与P4进行拼接,然后对拼接得到的特征图继续上采样至P3的尺寸,如此循环进行,直至完成所有层级的融合。我们在这里用替换顺序双线性上采样。

4.3. 图像修复

U-net结构在近期提出的图像修复方法中备受青睐,例如&Local和Conv。该网络的后半部分包含两个上采样算子。我们直接将这两个上采样层进行替换,并检验其性能表现。针对Conv,我们能够借助内容感知重组核来更新掩码,从而有效维持掩码的传播过程。

5. 实验5.1. 实验设置

数据集和评测标准。我们在若干核心密集预测测试集上进行了评测。通常情况下,我们以训练数据为依据进行模型训练,再利用验证数据来检验模型表现。涉及目标检测和实例分割任务。我们的实验是在难度较高的MS COCO 2017数据集完成的。最终结果采用规范化的COCO评测体系,具体为IoU值介于0.5至0.95区间的平均精度(mAP)。语义划分方面,我们借助参照物来检验自身方案在语义划分方面的成效。成效依据平均交并比(mIoU)以及像素正确度(P.A.)来判定,前者体现预测区域与实际区域间的平均相似度,后者则显示单个像素分类的正确程度。图像修补层面,我们依托特定数据集展开图像修补工作。评估标准设定为L1误差(数值越小越优)和峰值信噪比(PSNR,数值越高越佳)。关于具体实现过程,实验中固定使用一套超参数,除非有特殊声明,通道压缩器的参数值设定为64,内容编码器的参数值,具体实现细节请参考补充材料。针对目标检测和实例分割任务,我们在 RCNN和Mask RCNN模型上进行了评估,主干网络选用-50带FPN结构,并依照 和 的1x训练计划进行配置。对于语义分割任务,我们采用了官方提供的实现方案,并保持了一致性的实验配置。图像修复工作,我们选用了&Local和Conv这两种方法作为参照标准进行评定。

5.2. 基准测试结果

目标识别与物件划分。我们最初借助用邻近值估算取代 FPN 内部 RCNN 与 Mask RCNN 的邻近值估算,以及用特定构造替换 Mask RCNN 掩膜头反卷积层来检验我们的方案。表1揭示,该方案令 RCNN 的边界框精度提升,同样让 Mask RCNN 的掩膜精度增强。各项性能改善幅度均超越基准,说明它对各类尺寸目标均有积极作用。

图1所呈现的定性分析结果证实了我们相当不错的性能表现。我们察看了FPN自上而下的通路里的特征图,还将其和基准(也就是最近邻插值)做了对照。显而易见,借助内容感知的整合方式,特征图显得更加清晰,并且推断出了更为准确的目标轮廓。图4里,我们列举了一些实例分割的样例,用来对比基准和改进后的效果。

为了比较各种上采样方法的性能,我们在 RCNN 框架内尝试了多种算法在 FPN 结构中执行上采样操作,并且完成了许多测试工作。测试数据汇总在表格2里。其中,“N.C.”代表“邻近点+卷积”这种处理方式,“B.C.”则对应“双线性+卷积”这种处理方式,这两种方法在上采样步骤结束后都增设了一个卷积层。“P.S.”、“Pixel ”和“GUM”是三种典型的基于学习提升分辨率的方法,我们还考察了“空间注意力”(记作“S.A.”)。这种上采样算子获得了最高的平均精度,同时FLOPs和参数量都控制得比较少,这说明它既表现出色又具备效率。最近的实验数据揭示,单纯依靠“邻近点+卷积”或者“双线性+卷积”的组合方式,其参数数量的增加并未转化为明显的性能提升,反而,“”、“GUM”以及“空间注意力”等方法的表现都不如前者,这有力地证明了,要想获得理想的上采样效果,必须精心设计相应的算法结构。

除了FPN这种金字塔特征融合方式之外,我们还研究了掩码分支里各种不同的上采样方法,在常规的Mask R-CNN模型中,通常使用转置卷积层将区域提议特征放大两倍,为了确保对比的公正性,我们没有对FPN结构进行任何调整,只是用不同的算法替换了转置卷积层,因为我们只更改了生成掩码的部分,因此以掩码平均精度作为评价指标,相关数据见表3。在这些方法中,在实例分割方面取得了最佳性能。

表4中呈现了Mask RCNN的FPN与掩头部各自实现的目标定位及物件划分成效。各项测试均获得显著提升。同时完成了语义分割任务。我们将原有上采样模块更换为新型设计,并在标准数据集上检验其表现。表5揭示,通过这种改进,单尺度测试的mIoU指标实现了显著增长。特别指出,配备该模块的系统,其性能超越了当前主流的先进模型(例如与VGG16)。

依照4.2部分所讲,我们逐一考察了调整里各个部分的作用。表6里的数据证明,这三个部分都能得到改善,并且它们搭配在一起时效果更好。对于图像修补这类简单工作,我们也证实了它的适用性。我们在两种性能优越的基准方法Local和Conv中,把放大环节换成了新的算法,发现这两种技术都获得了明显进步。根据表7的数据,我们的技术在PSNR这个评测标准上,让两个基准方案分别提升了1.1分贝,并且另外一项基准方案也获得了0.2分贝的提高。

5.3. 消融研究与进一步分析

模型构造与参数调整。我们考察了构造模型时参数的作用,具体涉及通道压缩比例、编码器滤波器尺寸以及重组滤波器尺寸。同时,我们尝试了核标准化器中多种不同的标准化技术。借助配备-50主干的 RCNN,我们针对构造方案和参数配置开展了解耦分析,并运用 COCO 2017 验证数据集对分析结果进行了验证。

为了达成优质设计,我们起初考察了依据浮点运算数(FLOPs)评估的计算难度。当采用因子对输入通道为的特征图实施上采样时,其每像素FLOPs的运算量等于,具体内容见。

我们测试了通道压缩器中的各种参数。我们还移除了通道压缩器部分,让内容编码器直接利用输入数据来预测重构核心。表8的实验数据证明,压缩到64个单位不会降低效果,反而更有效率。如果继续压缩,效果会稍微变差。它无需通道压缩器也能获得同等表现,这表明通道压缩器能提升核预测速率而不牺牲性能。根据这些发现,我们通常把数值定为64,以此兼顾表现与效能。

我们接着考察了二者关联。显而易见,提升其一往往需要配合另一方的增长,毕竟内容编码器为预测较宽的重组核,必须拥有更宽广的感知范围。参照表9的数据,若同时增大二者,结果会更好,单独调整任何一方则效果平平。我们归纳出一个实用公式,在所有参数组合中表现突出。虽然扩大核尺寸确实有益,但出于兼顾效能与成本的考量,我们通常保持核大小与不变。

在函数之外,我们也考察了核归一化器里的其他几种替换方法,包括带归一化的那些,等等。根据表10的数据,“”与“ ”的表现完全一样,并且它们都比“”要好,这说明把重组核归一化为总合等于1这件事非常关键。

其运作机制。我们开展深入分析,探究其具体运作方式。借助经过训练且以作为上采样环节的Mask RCNN模型,我们在图5中展示了重构流程。通过特征金字塔网络(FPN)构造,低分辨率特征图会反复进行上采样,从而获得更高分辨率,因此上采样特征图上的一个像素点,会从更广阔的范围内汇集信息。我们选取了高分辨率特征图中的部分像素点,并考察了它们由哪些邻近像素点重新组合而成,绿色圆圈标示了示例位置,红色点则表明在重组环节中权重较高的源点,通过图像可以明确感知到内容识别的特性,这种特性倾向于将语义信息相近的点进行重新组合,人体上的某个位置更可能源自同一人体的其他点,而非其他物体或周边背景在那些含义不太明确的背景部分的位置,重新排列的结果更加平均,或者仅仅倾向于那些拥有相近初级纹理特性的点。

6. 结论

我们研发了内容感知特征重组技术,这是一种通用性强、结构简单且效果显著的上采样方法。该方法在目标检测、实例分割与语义分割以及图像修复等标准测试集上,性能分别得到大幅提升。同时,该技术增加的计算负担轻微,能够方便地融入当前流行的网络模型中。后续研究计划考察其在基础视觉任务(例如图像复原和超分辨率)领域的应用潜力。

感谢支持。此项目部分经费源自商汤科技集团(中大协议号:和)、香港研究资助局(GRF)(项目号:和)、新加坡教育部(MOE)AcRF一级(编号.020)、南洋理工大学(NTU)学生资助基金(SUG)以及NTU NAP的共同资助。

附录附录A. 详细实验设置

目标检测与实例分割任务,我们在以-50为核心网络的 RCNN 和 Mask RCNN 上进行了验证。这些方法运用了 FPN 技术。在模型训练和推理阶段,我们调整了输入图像的尺寸,确保其短边为800像素或长边为1333像素,并且维持了原始的宽高比。我们运用了同步SGD优化器,初始学习率设置为0.02,动量参数为0.9,权重衰减系数为0.0001。我们以16的批量规模,在8块显卡上并行处理,每块显卡分配2张图片。我们依照预定的方案进行训练,总共执行了12个训练阶段。在第8个和第11个阶段,我们调低了学习效率,使其变为原来的十分之一。

语义区分,我们选用基于-50核心架构的官方版本{ }^{3}。训练时,输入图样的短边尺寸随机在{300,375,450,525,600}中挑选。推演阶段,为进行公正对比,我们实施单尺寸检测,把图样的短边调整为450像素。训练与推演期间,图样长边的最大值均定为1200。我们运用同步随机梯度下降法,起始学习值设定为0.02,动量参数为0.9,权重缩减系数为0.0001。在八块图形处理器上执行,每块处理两张数据,批量规模取16,并实施同步批次标准化,这属于语义划分领域的标准配置。接着,我们采纳"多项式"式学习率调整方案,当前步骤的学习强度等于初始强度与某个因子的乘积我们将power设置为0.9,并总共训练20个周期。

图像修补工作,我们选用&Local里的生成跟判别网络当作基础模型。这个生成模型,把加了遮盖的图像当作数据源,然后做出对破损部分的复原。复原结果,我们把它和原始图像拼接起来。拼接后的图像,再交给判别模型去评估。为了让复原效果更佳,我们对基础模型做了些调整。和原始模型运用两个判别器不同,我们只在修复部分应用一个风格判别器,这种调整能够得到更优的图像品质。

为了确保对比的公正性并兼顾实际运用情况,我们选用了新增的自由形态遮罩当作二进制遮罩。针对 Conv,只需在生成器里把卷积层换成标准的 Conv模块即可。训练过程中,我们运用 Adam 优化器,设定学习率值为 0.0001,同时,训练数据的批量规模为 32。输入与输出数据均执行线性范围调整。

附录B. 的可视化

在图六里,我们借助其他案例阐述了内容关联重构的流程,在FPN构造的上行通道里,红色模块被转化为绿色核心模块。

附录C, 可视化效果对比, 涉及目标检测, 以及实例分割, 如图7, 展示了Mask RCNN作为基准, 与采用Mask RCNN的模型, 在COCO 2017验证集, 获得的目标检测与实例分割成果, 进行了详细对比

语义区分,参照图8,我们对比了验证集里的基准版本和改进版本在语义分割方面的表现,两者结果均有体现。

图像修复工作,如图9所示,对比了验证集里的&Local基准方法,以及应用了&Local的修复成效,两者进行了展示。

在这里插入图片描述

在这里插入图片描述

代码

提醒:请联系我时一定说明是从夜讯箱包皮具网上看到的!