ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）

小君 2023-07-28 09:43:21 909

ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）分类结果包含维，目标主要设定对应维度，样本定义分以下3种情况：对于目标，在训练时可映射到任意的FPN层，映射区域为。一般而言，。定义有效边界和忽略边界，可用于定义特征图中的正样本区域、忽略区域以及负样本区域。有效边界和忽略边界均与映射结果成等比关系，比例分别为和，最终的分类损失为所有正负样本的损失值之和除以正样本点数。如图2所示，60x60选择中间的anchor，而50x50以及40x40的则选择最小的anchor，anchor的选择都是人们根据经验制定的规则，这在某些场景下可能不是最优的选择。为了解决上述的问题，论文提出了简单且高效的特征选择方法FSAF(feature selective anchor-free)，能够在每轮训练中选择最优的层进行优化。如图3所示，FSAF为FPN每层添加anchor-free分支，包含分类与回归，在训练时，根据anchor-free分支

FSAF深入地分析FPN层在训练时的选择问题，以超简单的anchor-free分支形式嵌入原网络，几乎对速度没有影响，可更准确的选择最优的FPN层，带来不错的精度提升

来源：晓飞的算法工程笔记公众号

论文: Feature Selective Anchor-Free Module for Single-Shot Object Detection

ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）(1)

论文地址：https://arxiv.org/abs/1903.00621
论文代码：https://github.com/zccstig/mmdetection/tree/fsaf

Introduction

目标检测的首要问题就是尺寸变化，许多算法使用FPN以及anchor box来解决此问题。在正样本判断上面，一般先根据目标的尺寸决定预测用的FPN层，越大的目标则使用更高的FPN层，然后根据目标与anchor box的IoU进一步判断，但这样的设计会带来两个限制：拍脑袋式的特征选择以及基于IoU的anchor采样。

ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）(2)

如图2所示，60x60选择中间的anchor，而50x50以及40x40的则选择最小的anchor，anchor的选择都是人们根据经验制定的规则，这在某些场景下可能不是最优的选择。

ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）(3)

为了解决上述的问题，论文提出了简单且高效的特征选择方法FSAF(feature selective anchor-free)，能够在每轮训练中选择最优的层进行优化。如图3所示，FSAF为FPN每层添加anchor-free分支，包含分类与回归，在训练时，根据anchor-free分支的预测结果选择最合适的FPN层用于训练，最终的网络输出可同时综合FSAF的anchor-free分支结果以及原网络的预测结果。

Network Architecture

ocr预训练模型（嵌入anchor-free分支来指导acnhor-based算法训练）(4)