基于知识的神经符号结合的离散推理研究

导读

本次分享题目为基于知识的神经&符号结合的离散推理研究。今天的分享主要是在知识图谱和逻辑推理的命题下，围绕神经和符号结合的推理，在问答领域的一些探索和研究。

主要内容包括以下几大部分：

以轻量级算子为核心的文本离散推理
基于知识的统一离散推理：程序生成
基于大模型的零样本&少样本推理现状
总结与展望

分享嘉宾｜鲍军威博士京东科技算法科学家

编辑整理｜张琛蚂蚁金服

出品社区｜DataFun

01/以轻量级算子为核心的文本离散推理

该工作发表于 NAACL 2022（OPERA: Operation-Pivoted Discrete Reasoning over Text）。

1. 基于文本知识的离散推理型阅读理解

image-fbf7489d28ad40a9a4fef7ec2791c47b.png-imageStyle

阅读理解是在给定一段文本以及相应问题的基础上，从中抽取或者计算出问题的答案。除了文本抽取之外，还包括数值计算、比较、排序等一些复杂逻辑推理问题。

2. 相关工作分类及特点

image-e08bf71312c84c9e96cdf602f86c6aa0.png-imageStyle

（1）Semantic Parsing-based model

在给定一段文本和问题之后，通过 Semantic Parser 解析成一段可执行的程序从而获得答案。该方法的可解释性比较强，但存在的问题也比较明显，非常依赖大量的逻辑表达式或者程序作为标注数据来训练监督模型。

（2）MOE-based model

在给定一段文本和问题之后，会通过 Encoder 进行编码后输入到 Reasoning Module 推理模块，再输入到不同的专家系统后给出相应的答案。该方法的性能表现会更优，但可解释性会弱一些，同时也缺乏直接做离散推理的模块。

3. 解法思路：算子设计

image-4f35903d55cd4b34aa847eae8bb553c4.png-imageStyle

我们的问题可以抽象为：在给定文本 P 和问题 Q 的条件下，求解一个概率模型来得到答案。首先将问题概括为一组相关的算子，并且通过神经网络模块去模拟这种算子的执行。将这样一个端到端的模型拆分成两个部分，第一部分基于文本 P 和问题 Q 来预测所涉及到的算子，第二部分根据算子再进一步推理出答案。

4. OPERA 模型架构

image-520c044849904966bf830730732fe3df.png-imageStyle

OPERA 模型架构如图，它主要包含一个上下文的 Encoder、一个轻量级的算子推理模块以及 MOE 的预测模块，同时包含很多专家分类器。

算子模块主要包含以下三个部分：

（1）算子选择 Operation Selector：

image-6201c788be0e4b0aa1d87429de7fddb4.png-imageStyle

（2）算子执行 Operation Executor：

image-ff29615de2fb484484542a99e7ac9ba5.png-imageStyle

（3）预测 Predictor：

image-2ce559f13aed4709a959b7e415c32a56.png-imageStyle

在 DROP 数据集上的实验结果表明，该方法比之前方法有显著提升。

image-c5e6b1233cf24974b8afbc88e04c05cf.png-imageStyle

02/基于知识的统一离散推理：程序生成

在面对结构化或者是混合结构化的混合异构数据中做推理和理解，我们提出了基于知识的统一的离散推理来进行程序生成的方法，即 UniRPG-2: Unified Knowledge-Grounded Numerical Reasoning as Program Generation，该工作为发表于 EMNLP2022 上的 UniRPG 的进一步扩展。

1. 基于异构知识的离散推理型阅读理解

本文地址：基于知识的神经符号结合的离散推理研究
本文版权归作者和AIQ共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出

该框架是面向异构知识的语义解析推理方法，不仅能够处理例如 TAT-QA 数据这样 single-turn 的对话，也能够处理 PACIFIC 这样 multi-turn 这样的多轮问答。该体系架构的优势是可解释性更强，它能够生成一个逻辑表达式或者程序，通过对程序的执行来得到答案，从而实现逻辑推理。另一方面，对于异构知识的通用性更强。体系架构图如下：

image-ecefc73f8415418d80a35c4f83dc37d6.png-imageStyle

2. UniRPG-V2 模型架构

image-bd534530946a4111b528de8cf770d675.png-imageStyle

模型架构如图，它可以处理纯文本、纯结构化的表格或者两者异构的数据。在 encoder 阶段，对于异构数据会先进行 structure-aware knowledge reader 做一个表征，拆分为 lower layers 和 higher layers，并做 mask 掩码操作，能够获取异构信息中同行或者同列的前后文信息。在 decoder 阶段，pointer 可以通过 attention 机制定位输入位置，同时通过 prediction vocab 模块去生成算子，从而生成一个可执行的 program。

3. 实验结果及可解释性分析