55

动态 | ACL 2018 公布四篇最佳 demo 候选论文,三篇论

 5 years ago
source link: http://www.10tiao.com/html/692/201807/2247491708/3.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

雷锋网 AI 科技评论按7 月 9 日,自然语言处理顶会 ACL 公布了最佳 demo 论文的四篇候选论文,名单如下:

  • CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation

  • Out-of-the-box Universal Romanization Tool

  • Platforms for Non-Speakers Annotating Names in Any Language

  • YEDDA: A lightweight Collaborative Text Span Annotation Tool

值得注意的是,四篇论文中有三篇论文的一作是中国研究者,他们分别是目前任职于三星美国研究中心的 Yilin Shen,伦斯勒理工学院博士生 Ying Lin,新加坡科技设计大学(SUTD)博士生 Jie Yang。最佳 demo 论文奖将在主会最佳论文 session 环节揭晓,届时雷锋网 AI 科技评论将会第一时间带来现场报导。

本文将对这四篇论文进行简单介绍。

最佳 demo 论文

CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation

  • CRUISE:基于迭代语料生成的冷启动新技能开发

  • 论文摘要:我们提出了 CRUISE 系统,它可以指导普通软件开发者从头开始构建高质量的自然语言理解(NLU)引擎。构建该引擎是给个人助手(智能语音助手)添加新技能的基础步骤。与开发者或众包手动标注大量语料的现有解决方案不同,我们设计了一种基于规则和数据驱动的混合方法,该方法可以迭代生成越来越多的语料。我们的系统只需要少量人工在迭代中修改错误语料即可。CRUISE 系统会生成一个「训练有素」的 NLU 引擎,同时还会生成一个大型已注释语料库,第三方可以基于此来开发自定义技能。通过使用基准数据集和自定义数据集,我们收集到了现实世界的设定,NLU 性能比赛和人类评价则证实了 CRUISE 生成语料的高质量。我们的工作大幅降低了人类认知负荷,同时缩短了人工剪枝时间。

  • 论文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin

Out-of-the-box Universal Romanization Tool

  • 开箱即用的通用罗马化工具

  • 论文摘要:我们想介绍 uroman,这个工具可以把五花八门的语言和文字(如中文、阿拉伯语、西里尔文)转换为普通拉丁文。该工具基于 Unicode 数据以及其他表,可以处理几乎所有的字符集(包括一些晦涩难懂的语言比如藏文和提非纳文)。uroman 还可以将不同文本中的数字转换为阿拉伯数字。罗马化让比较不同文本的字符串相似性变得更加容易,因为不再需要将两种文字翻译成中间文字再比较。本工具作为一个 Perl 脚本,可以免费提供,可用于数据处理管道和交互式演示网页。

  • 论文作者:Ulf Hermjakob, Jonathan May,Kevin Knight

Platforms for Non-Speakers Annotating Names in Any Language

  • 未知语言标注平台

  • 论文摘要:我们将演示两个标注平台,在该平台上,英语母语者即使不熟悉某种语言也可以用该语言进行标注。这些平台可以为低资源语言提供高质量的「银标」注释。平台目前在 LoreHLT20171 上的奥罗莫语和提格里尼亚语上取得了最佳成绩,在 TAC-KBP EDL2017 的十项语言上取得了最佳成绩。我们讨论了平台的优点和局限性,并与其他的未知语言标注方法进行了比较。我们将向研究者们公开该工具。

  • 论文作者:Ying Lin, Cash Costello, Boliang Zhang, Di Lu, Heng Ji, James Mayfield,Paul McNamee

  • 地址:http://aclweb.org/anthology/P18-4001

YEDDA: a lightweight collaborative text span annotation tool

  • YEDDA:一种轻量型文本范围注释工具

  • 论文摘要:在论文中,我们将介绍 YEDDA——一个轻量、高效且全面的开源文本范围注释工具。Yedda 为文本范围注释提供了系统化的解决方案,涵盖了用户协作标注到管理员评估与分析等需求。Yedda 可以用命令行和快捷键对文本进行标注,并以此克服传统文本标注工具的低效率,用户可以自定义命令行和快捷键。Yedda 还可以通过学习最新标注文本智能化为用户提供标注意见。我们还开发了管理员客户端用以评估多个注释器的标注质量,并为每个注释器生成详细的比较报告。实验表明,相较于现有标注工具,我们的系统可以节省一半的时间,使用智能推荐还能再节省 16.47% 的时间。

  • 论文作者:Jie Yang, Yue Zhang, Linwei Li and Xingxuan Li

  • 地址:https://arxiv.org/abs/1711.03759

via:https://acl2018.org/2018/07/09/best-demo-candidates/

雷锋网 AI 科技评论将会第一时间为大家带来 ACL 现场报道,敬请关注。

┏(^0^)┛欢迎分享,明天见!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK