48

南京航空航天大学开源ALiPy:用于主动学习的Python工具包

 5 years ago
source link: https://www.jiqizhixin.com/articles/2019-01-18-7?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
  • 论文链接:https://arxiv.org/pdf/1901.03802.pdf

  • ALiPy 官网地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html

简介

ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。

特征

模型独立

不限制分类模型的类型。用户可以按需求在 sklearn 中使用 SVM ,或者在TensorFlow中使用深度模型。

模块独立

用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。

无需继承即可实现自己的算法

对用户自定义函数限制极少。

支持不同设置

支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。

强大的工具

保存和加载中间结果、多线程、分析实验结果等。

快速启动

用户可以通过以下命令启动 ALiPy:

pip install alipy

详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。

  • 对于不太熟悉主动学习、 只是想对数据集应用该方法的用户 ,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用几行代码运行主动学习流程,无需了解任何背景知识。

  • 对于 想要对现有主动学习方法进行实验评估的用户 ,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,了解 7 种不同设置下的 20 余种当前最优算法。

  • 对于 想要实现自己的算法、执行主动学习实验的用户 ,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,学习如何使用 ALiPy 轻松实施主动学习实验。

实现策略

ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。

a6bya27.png!web

6JVBz2Q.png!web

如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:

实例查询

6viyMjM.png!web

Noisy Oracles

YRrAn2n.png!web

不同成本数据集

MFv2Iry.png!web

特征查询

JrmQNjM.png!web


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK