3

目标检测入门——术语篇

 2 years ago
source link: https://hotelll.github.io/2021/03/27/%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B%E5%85%A5%E9%97%A8%E2%80%94%E2%80%94%E6%9C%AF%E8%AF%AD%E7%AF%87/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
Hotel's Blog
Toggle site
Catalog
You've read100%
目标检测入门——术语篇
2021-03-27|人工智能
Word count: 436|Reading time: 1 min

这篇博客记录着目标检测领域下常见的专业术语。

术语 解释

IoU 图和框的 交集/并集,判断检测是否正确的阈值,通常为 0.5。

P 每张图像中被检测出的正确目标占总目标数的多少。

AP 对于一个类别的平均精度,图像个数/总精度和。

MAP 所有类别的平均精度和/总类别数。

AP50... AP50代表 IoU 取 0.5,AP60代表 IoU 值取 0.6。数值越高越难。

ROI Region of Interest,有很大可能性包含检测目标的区域。

Anchor 预先设定在图像上的密集方框,用于后续检测标记。

Region Proposals 建议区域,经过 Region Proposal Network(RPN) 得到一个 region 的 p≥0.5,则这个 region 中可能具有目标,这些选出来的区域被称为 ROI(Region of Interests)。RPN 同时会在 feature map 上框定 ROI 大致位置,输出 Bounding-box。

one-stage 一步检测器,指从图片到检测结果一步到位。(e.g. YOLO, SSD)

two-stage 两步检测器,指分两步走,先从图片提取 ROI,再进行检测。(e.g. RCNN, FPN, etc.)

skeleton 骨骼点,常见于行为检测数据集,标记人体几个重要位置的数据。

Re-ID 行人重识别,利用计算机视觉技术判断图像或者视频序列中是否存在特定人的技术。

backbone 图像特征提取器,往往是目标检测的第一步,常用 ResNet

head 分类+定位器

neck 插在 backbone 和 detection head 之间的模块,使网络更好地融合/提取 backbone 给出的特征,提高网络性能,例如:FPN,NAS-FPN,PAN,ASFF,RFB,SPP。这部分是科研的主攻点。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK