38

NLP技术路线详解:这是从数学到算法的艺术

 4 years ago
source link: https://www.tuicool.com/articles/UBfYR3n
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

自然语言处理路线图详解,从数学基础、语言基础到模型和算法,这是你该了解的知识领域。

自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法。相比图像或语音,文本的变化更加复杂,例如从预处理来看,NLP 就要求我们根据对数据的理解定制一种流程。而且相比图像等更偏向感知的智能,自然语言包含更高一级的智能能力,不论是承载思想、情感还是推理。

那么我们该怎样学习自然语言处理,有什么比较好的路线吗?通常而言,在数学和机器学习的基础上,我们还需要了解自然语言的规则与现象,这样才能进一步探讨该怎样处理自然语言。

本文介绍刚刚发布的一个开源项目,韩国庆熙大学本科生 Tae-Hwan Jung 总结了一套 NLP 的技术路线图。值得注意的是,Tae-Hwan Jung 此前已经开源了很多优秀的项目,包括 4.3k+ star 量的 NLP 教程。

  • 项目地址:https://github.com/graykode/nlp-roadmap

Tae-Hwan Jung 表示,本项目面向对 NLP 感兴趣的学生,该路线图提供了学习 NLP 的思维导图及关键词信息,它覆盖了从概率/统计到 SOTA NLP 模型的素材。

3maE7rV.png!web

如上所示为 NLP 的技术基石,最基础的当然还是数学和算法方面的知识,此外语言学和机器学习知识也必不可少。再往上主要是文本挖掘与 NLP,在作者看来,前者更偏向于常规的算法与浅层机器学习模型,后者更偏向于深度学习模型。

四大技术线路图

如下从概率和统计到深度学习方法展示了四大技术路线图,它们从基石到高层展示了完整的知识领域。

概率与统计

BBbQNzF.png!web

机器学习

IZNz63b.png!web

文本挖掘

7BB7RjZ.png!web

自然语言处理

FR3MJrU.png!web

注意:

  • 关键词之间的关系可能解释得比较模糊,因为是以语义思维导图的方式表示的。

    读者们只需要看方框内的关键词就行,把它们当作必学部分;

  • 在一张图中容纳如此多的关键词和知识点,非常的难,因此,请切记该路线图只是一种思路或者建议;


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK