COLING 2018 最佳论文解读：序列标注经典模型复现

■ 论文 | Design Challenges and Misconceptions in Neural Sequence Labeling

■ 链接 | https://www.paperweekly.site/papers/2061

■ 源码 | https://github.com/jiesutd/NCRFpp

引言

这篇论文是 COLING 2018 的 Best Paper 之一 “Most Reproducible Paper”，论文基于的 PyTorch 代码框架 NCRF++ 也收录于 ACL 2018 的 Demo Paper。

作者用一个统一的序列标注框架实现了不同模型架构在 NER, Chunking, POS Tagging 数据集上的表现，并对已有工作的一些不一致的结论进行了检验，发现了新的结论。代码在 Github 上已经开源，使用文档也非常详尽，做序列标注的童鞋们又多了一把利器可以使用。

任务

CoNLL 2003 英文的命名实体识别(NER)
CoNLL 2000 Chunking
PTB POS Tagging

模型

字符序列表示

在词的表示方面，本文摒弃了基于传统的特征的方法，直接使用词本身的信息进行编码。除了词向量以外，为了更好地对那些不常见的词编码，文章使用 LSTM 或者 CNN 对构成词语的字符进行编码。

N3meQzn.png!web

词序列表示

在整个句子级别，文章同样使用 LSTM / CNN 对构成句子的词语的表示进行上下文的编码。

muQRnmB.png!web

预测层

获取了每个词的上下文表示之后，在最后的预测层，文章使用了基于 Softmax 的和基于 CRF 的结构。和 Softmax 相比， CRF 往往更能有效地结合上下文的标签的依赖关系进行预测。

实验结果

NER的实验结果

NRf2ymu.png!web

Chunking的实验结果

j2Yr63J.png!web

POS Tagging的实验结果

BjyaeqI.png!web

从以上结果来看，字符序列的表示方面，CNN 和 LSTM 的结果差别不大；词序列的表示方面，LSTM 的结果比 CNN 的稍好一些，说明全局信息的有效性；预测层方面，POS Tagging 任务的 CRF 和 Softmax 表现相当，但是 NER、Chunking 的 CRF 的结果要比 Softmax 好一些。相比 POS 的tags，BIE 标签之间的依赖关系可能更容易被 CRF 所建模。

其他

这篇文章也检验了预训练的词向量的不同（GloVe/SENNA），标注体系的不同 (BIO/BIOES)，运行环境的不同（CPU/GPU），以及优化器的不同（SGD/Adagrad/Adadelta/RMSProp/Adam）对结果的影响。感兴趣的同学可以查看论文原文。

最后

本文代码已开源，使用非常方便，也可以加自定义的 feature，几乎不用自己写代码就可以使用了。

引言

任务

模型

字符序列表示

词序列表示

预测层

实验结果

NER的实验结果

Chunking的实验结果

POS Tagging的实验结果

其他

最后

Recommend

反式(p-i-n)钙钛矿太阳能电池里程碑，Voc 1.21 V

Graylog分析Nginx日志并通过GeoIP2获取访问者IP的地理位置信息-BigBoss

某系统单点登录性能测试诊断分析优化过程-郭柏雅

Kubernetes核心概念之Volume存储数据卷详解-linux运维技术

阿里云故障，又是运维的锅?

【译】React v16.4.0：你可能并不需要派生状态（Derived State）

鹅厂4面

抖音们疯狂的补贴大战

神秘而强大的第四种物质状态：北极光中存在的等离子

碰到这三种的物质友情提示：你大概连哭都来不及

About Joyk