王仲远 | 基于概念知识图谱的短文本理解

本文转载自公众号:大数据创新学习中心

3月10日,美团点评AI Lab NLP负责人王仲远博士,给大家进行了题为“基于概念化的短文本理解(Conceptualization for Short Text Understanding)”的报告。

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sJdiczFGcyYLPWKWKiclksW1ibappK4OZnH2Iic6kwP6QIPAnMfk0DRRgtg/640?wx_fmt=png&wxfrom=5&wx_lazy=1

王博士的这次报告主要分为3个步骤:通过理解短文本问题,引出知识图谱概念;讲解知识图谱的技术;以及应用场景。

他首先从通俗易懂的小例子入手,讲解了短文本。短文本比较稀疏,而且是充满噪音并包含歧义的。由于这样的特性,传统方法使得机器对短文本理解十分困难。并指出了当前搜索引擎面临的诸多问题。人类由于额外知识源,对于这种短文本的理解却很容易。

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3seIBt6PzaxGxDvcWzL5Vyo4wh2Zpx76YIH85GUJiamoTmb3SnkibjL7mg/640?wx_fmt=png&wxfrom=5&wx_lazy=1

按照人类理解问题和回答问题的过程,可以将知识分两类—常识性知识和百科全书式知识(区别如下图)

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sEOribMOL9odx1Cwg7lIPBqwUUInWxe1E6POGrmloxBz30NxHL3w0FHg/640?wx_fmt=png&wxfrom=5&wx_lazy=1

而后,通过生动的例子讲解指出人们对于短文本的理解,会将它们映射到一个概念空间,再根据上下文进行推理。

紧接着,指出将常识知识加入到计算推理中

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sqksrnRqP1OicG7PcicmQfFThbGHExQOPbhf6Goatmn4mUeRtOUxLsukA/640?wx_fmt=png&wxfrom=5&wx_lazy=1

以实例讲解“概念化”:将文本映射到概念的空间。

又以例子具体讲解相关技术,如对实体进行正确的推理,挖掘字典关系,构建概念模型以及需要注意的事项等。

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sgTbdXIAAS4GCaVrDRE6MtPLbdbzmwU3XJeZrYFDJe36yXUWKm6ypHA/640?wx_fmt=png&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3smh5W8IAtbE8WpMlPHTEOamsn67H6vhzT56GpibxriajtoOzv0eM6sfZA/640?wx_fmt=png&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sGR2ZrDpibqQhrQV7hpeGUqd4sibHaXJlT5eYf980yZDrzjpabUgycRGw/640?wx_fmt=png&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sGX59iaaq6N4JaR7vcicRWyh7k9FVCXYYJBYaKsNyzGEsX9SQl0y4F04g/640?wx_fmt=png&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3sVq8tInk4S7lKuiconfwwPqXEzMgCQ9Bdy0xQV4icnibbial0iauHZCxibgPg/640?wx_fmt=png&wxfrom=5&wx_lazy=1

最后,王博士讲了这些技术的实际应用场景结束了这次精彩的汇报演讲。

https://mmbiz.qpic.cn/mmbiz_png/Ip0jLQuUcxlWUyxp0dXFoib0Ila8ZPr3swiarYT7ROxqqmL3zptpAtDhYibpyDnW0et3tkr68wic21XBd3Y2yJoWKw/640?wx_fmt=png&wxfrom=5&wx_lazy=1


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

https://mmbiz.qpic.cn/mmbiz_jpg/GNpj5fw72EotiadhuOd6wlGaHBnEibHXIyUN9f1vq8QsMmnV71jxkmqhSLuZUNVC9LdPmC3mzD2u2s05gN2L4FOg/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

发表评论

邮箱地址不会被公开。 必填项已用*标注