42

计算机视觉领域最好用的 5 个开源图像标注工具

 4 years ago
source link: https://www.tuicool.com/articles/rqaqey7
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

q6nu63U.png!web

本文介绍了 5 个很棒的标注工具,我希望它们能帮助你创建计算机视觉数据集。

如果你是一名计算机视觉领域的数据科学家,你可能也意识到了你需要一个快速而简单的标注工具,其原因至少是以下两个之一:

  • PoC(译者注:Proof of Concept)或研发实验需要创建数据集
  • 保证你的数据质量,这样它就不会影响你的深度学习算法的性能

我深入探究了计算机视觉标注领域,发现它包含了大量令人印象深刻的工具(请看如下三个超级棒的工具清单: 清单一清单二清单三 ,或者查看 这个博客 )。我花了相当多的时间比较最有前景的(和活跃的)项目,发现其中大部分工具都只能达到如下三个设计目标中的其中一个:

  1. 如果你想在标注行业展开业务,你需要:
  2. 先进的项目管理功能
  3. 足够多的功能,以完成任何标注任务
  4. 提高效率的自动化工具
  5. 如果你属于一家创业公司,你可能需要:
  6. API,或者至少是将标注工具连接到私有 API 的简单方法
  7. 直观的用户体验(UX),使你临时聘用的每个标注人员都可以立即开始工作
  8. 如果你只是为自己工作,你:
  9. 不用关心 API 或者项目管理
  10. 只是想尽快开始标注!

下面是我最喜欢的工具列表,这些工具允许为计算机视觉应用标注包围框(用于物体检测任务)和多边形框(用于分割任务)。

如果你发现这些工具不能正常工作,请尝试在 Chrome 中运行它们。

[可选] 计算机视觉标注的简要基础知识

在计算机视觉中,训练算法的数据主要有三种类型:

  1. 图片 + 分类器训练标签( ResNets
  2. 包围框 + 检测器标签( YOLOv3,Faster R-CNN ……)
  3. 多边形 + 用于分割应用程序标签( Mask R-CNN

NNJrM3u.png!web 注意分割数据(蓝色)与检测数据(紫色)的差异

正如你很可能已经意识到的,对于 AI 项目来说,成功的最重要的影响因素之一是你可以使用的“优质数据”的数量。我所说的计算机视觉应用的“优质数据”是指:

  • 每个图片 / 标注都有一个恰当的标签
  • 每个边界框或多边形都紧致地包围着要训练的物体。

即使后一种定义明显缺乏客观性,但我们希望我们的算法能够达到人类的水平。因此,我们需要“人类水平”的标注。

打标公司的最佳开源标注工具

计算机视觉标注工具(CVAT)

mYjEFvq.png!web
计算机视觉标注工具(CVAT)

在推出 OpenCV 近 20 年后,Intel 在计算机视觉领域再次发力,并发布了 CVAT,这是一个非常强大和完整的标注工具。尽管它需要一些时间来学习和掌握,但它包含了大量的功能来标注计算机视觉数据。

优点:

  • 它很容易安装和扩展,因为它是一个运行在 Docker 中的 Web 应用程序
  • 它包含了许多自动化工具(如使用 TensorFlow 物体检测 API 的自动标注、视频插值……)
  • 它允许协同工作管理,这样团队中的不同成员就可以在同一个标注任务上协同工作

缺点:

  • UI 相当复杂。例如,对于初次设置标注任务的用户而言,这可能会非常棘手
  • 一开始用起来不是很直观,可能需要几天的时间来掌握
  • 只能运行于 Chrome,所以如果你担心谷歌……,你必须找到其他变通办法

点击这里查看在线 演示

创业公司的最佳开源标注工具

可视化对象标注工具(VoTT)

fMbayuQ.png!web
可视化对象标注工具(VoTT)

VoTT 是由微软开发的,它提供了非常棒的用户体验,这可能会在你标注时为你节省大量的时间和精力。而且,创建项目也很直接,所以你可以不用深入阅读其文档就能使用它。

优点:

  • 代码写得非常好(在 React 中),并且完美地定义了接口,因此获取代码和添加所需的额外功能都很容易
  • 正如我所说的,UX 是完美的,它有一个黑色的主题和一个跟随鼠标的虚线网格,所以很容易知道从哪里开始标注一个边界框。这看起来像是一种额外嘉奖,但是相信我,这对于标注来说真的很重要!
  • 它提出使用深度学习算法来自动检测对象(它附带了在 COCO 数据集上训练的 SSD 模型)
  • 它是一个 web 应用程序和一个电子应用程序。这使你可以将它作为一个重客户端使用,也可以将它作为 web 浏览器中运行的应用程序来使用

缺点:

  • 要使用 web 应用程序版本,你需要将数据托管在微软的云计算服务 Azure 上(然而,电子版应用程序允许你在硬盘上使用数据,但需要使用 npm 安装程序)
  • 它没有提供一个内置的 API(但是,通过调整代码,使你的私有 API 能够与之通信,这是非常容易的)
  • 你不能给整张图片贴标签:你只被允许绘制带有相关标签的边界框(或多边形)。因此,它不适合创建 分类数据库

点击 这里 查看我们的网页应用程序!

DataTurks

fieAV3F.png!web

DataTurks 是一家成立于 2018 年的初创公司,提供图片、视频和文字的标注服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在 2019 年 2 月买下了它有关),此前你都必须向其付费。尽管在那之后,他们几乎没有对外发声,而且似乎已经停止了任何开发,但是这个标注工具非常棒,而且现在是免费的!

当你使用它的时候,不用在意任何许可,也不用考虑随处可见的任何非商业用途的限制条款。Dataturks 现在免费啦,而且你可以使用它的所有功能(我已经尝试和测试过了)!

优点:

  • 说起 CVAT,它是一个在 Docker 中运行的 Web 应用程序(查看 这里 获取 Docker 图像)
  • 允许协作和异步工作:处理相同数据集的两个队友不会得到相同的图像进行标注
  • 提出一种用于创建和获取标注任务的 API

缺点:

  • DataTurks 似乎已经停止了其产品的开发
  • UX 还可以,但是一些小小的调整还可以让它变得更好

点击 这里 查看在线演示!

仅为你自己服务的最好的开源图像标注工具

nmQ77fb.png!web

MakeSense.ai

Make-Sense

Make-sense 在两个月前刚刚发布(如果你在很久之后才读到我这篇文章,说明下,这个时间是 2019 年 6 月),并且已经拥有了令人难以置信的用户体验。开始启动打标从来没有这么快!进入网站,拖放你的图片,即可开始标注。

优点:

  • 快速,高效,但最重要的是,简单!
  • 很酷的用户体验
  • 至于你上传的图片的隐私问题,不要担心,因为他们说:“【我们】不会存储你的图片,因为我们不会把它们发送到任何地方。”

缺点:

  • 不提供任何项目管理功能
  • 也不提供任何 API

点击 这里 开始打标!

我希望这篇文章能够帮助你选择一个适合你需要的打标工具,如果你找到了更好的工具,请尽管在评论区告诉我们!

ps:以下是其他一些工具的简短列表,这些工具尽管我没有提到,但是都很酷。

  • VGG VIA ,一个非常容易使用的标注器,其由牛津机器人实验室开发。它被编码在单个的 html/js 文件里,所以它很容易进行开发!
  • LabelMe,由麻省理工学院开发的。在 这里 可以看到一个在线版本,或者在 这里 可以运行它。
  • Coco-Annotator 似乎功能很齐全,但它是最近才出现的(用户身份验证系统、API 接入点)。查看 这里 的演示( 用户名 :admin 密码 :password)

原文链接:

https://blog.sicara.com/best-open-source-annotation-tools-in-computer-vision-4b9f6a18f911


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK