知识工场 | 让机器认知中文实体 —复旦大学知识工场发布中文实体识别与链接服务

本文转载自公众号:知识工场

一、什么是实体识别与链接

近年来,如何通过知识图谱让机器实现自然语言理解受到越来越多的关注。其中,识别文本中的实体,并将它们链接到知识库中,是让机器理解自然语言的第一步,也是至关重要的一步。比如,当智能问答系统在回答“李娜在哪一年拿到澳网冠军?”这一问题时,第一步就是识别并在知识库中找到网球运动员李娜这一实体,才能继续从知识库中找到相关信息并作出回答。如果识别出错或者没有将“李娜”正确链接到网球运动员李娜这一实体的话,系统对于这个问题的回答必然出错。根据我们的调研,目前面向通用领域的中文实体识别与链接服务,能够公开可用且取得满意效果的还不多见。

继续阅读“知识工场 | 让机器认知中文实体 —复旦大学知识工场发布中文实体识别与链接服务”

知识工场 | CN-DBpedia 漫游指南

本文转载自公众号:知识工场

CN-DBpedia于2015年12月上线以来,已经有两年多的时间了,在数据层面做了大大小小百余项完善,在CN-DBpedia 3.0 即将上线之际,尽管我们觉得离完美还有距离,但也是时候拿出来让大家看看了。于是知识工场实验室做了一个知识图谱可视化系统,取名叫Curiosity,如果你也好奇,就点开看看啰。

继续阅读“知识工场 | CN-DBpedia 漫游指南”

鲍捷 | 知识图谱从 0 级到 10 级简化版

本文转载自公众号:文因学堂


文因学以前写过几个进阶指南,可能都太难,不接地气。这里重新写一个更实事求是、更便于工程落地的版本yiqm  df以前写过几个进阶指南,可能都太难,不接地气。这里重新写一个更实事求是、更便于工程落地的版本。

0级:掌握正则表达式、SQL、JSON和一门支持if-then-else的高级语言  —— 是的,这些不是知识图谱技术,但是这些可以解决问题。我们要的是解决问题,不是吗?

1级:学会ER建模(对,就是数据库里的ER建模),理解实体(Entity)和关系(Relation)的概念。这个可能比你想象得难很多。学会更复杂的SQL,能熟练掌握至少一种主流的关系数据库,至少学会一种语言的数据库操作。

2级:学会两种给实体命名的方法:数据库里的主键,Web上的URI。理解分类树。这时候可以学下RDF了,掌握Turtle和JSON-LD两种语法。会用Java或者Python操作RDF。(小白一般到这里就开始大批阵亡)

继续阅读“鲍捷 | 知识图谱从 0 级到 10 级简化版”

技术动态 | 手把手带你入门微软 Graph Engine

本文转载自微软研究院 AI 头条公众号,作者为李亚韬。

导读:出自微软亚洲研究院的 Graph Engine(原名Trinity)是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户高效地处理大规模图数据,且更方便地构建实时查询应用和高吞吐量的离线分析平台。自 2015 年发布以来,Graph Engine 受到了来自学术界和工业界的广泛关注。访问 Graph Engine 的 GitHub 页面(https://github.com/Microsoft/GraphEngine)。

继续阅读“技术动态 | 手把手带你入门微软 Graph Engine”

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

1. 工具特色

FudanDNN-NLP3.0 是由复旦大学计算机学院机器人研究实验室所开发的基于深度学习的中文自然语言处理工具,该工具目前可用于中文分词、命名识别、词性标注、句子分类、语义分析、知识库访问、对话问答。深度学习方法的优点在于不需要预先根据任务进行特征的选择(特征工程),系统所需参数较少(节省内存开销),并且实际使用速度优于其它相似性能的系统。该工具目前具备以下特点:

继续阅读“技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0”

技术动态 | 揭开知识库问答 KB-QA 的面纱 9 · 非结构化知识源篇

​作者,四川大学博士生,刘大一恒。本文已经获得 ChatbotMagazine 公众号授权。
内容速览
☛ 非结构化的知识库——维基百科☛ 思路与模型(文档检索与文档理解;段落encoding、问题encoding与答案预测)☛ 实验与总结

如果你想寻找一个问题的答案,比如谢霆锋的出生年月,那么你可能会先去查看关于谢霆锋的百度百科 或者 维基百科,找到和出生年月相关的那一行信息,再提取答案。那么,我们能不能让机器也这样去回答问题呢?在我们前面讲到的文章中,我们都使用了结构化的知识库来回答问题,今天我们将介绍一种使用非结构化的知识库——维基百科作为知识源来进行KB-QA。

继续阅读“技术动态 | 揭开知识库问答 KB-QA 的面纱 9 · 非结构化知识源篇”

技术动态 | 基于深度学习知识库问答研究进展

本文整理自刘康博士在 4 月 29 日广州知识图谱与问答系统论坛上的演讲。

大家好。我这个报告的题目是基于深度学习的知识库问答研究进展。其实就是想跟大家介绍,目前在做面向知识库问答的时候,一个解决的方案是用 Deep Learning 来做。

1 问答系统的历史

那么首先的话我们来回顾一下问答的一些历史的一些情况。我们现在用搜索引擎的话,其实用户来访问数据,还是以文档列表的形式。当用户问一个问题的时候,是需要用户在下面排序的结果中,来找到自己所需要的答案,其实搜索引擎并不能直接给你最精准的答案。另外,我们现在有各种各样的可穿戴设备,屏幕的缩小需要我们这个系统能够自动的从我们的数据库,或者我们的文本库里面,抽取最精准的答案。

继续阅读“技术动态 | 基于深度学习知识库问答研究进展”

技术动态 | 揭开知识库问答 KB-QA 的面纱 7 · 深度学习下篇(一)

作者,四川大学博士生,刘大一恒。本文已经获得 ChatbotMagazine 公众号授权。
内容速览

☛ 什么是记忆网络

☛ 基于记忆网络的KB-QA

☛ 小结

在上两期,我们分别介绍了使用深度学习的卷积神经网络对向量建模和语义解析方法进行提升的两篇经典论文。(详情翻查公众号历史记录。)

继续阅读“技术动态 | 揭开知识库问答 KB-QA 的面纱 7 · 深度学习下篇(一)”

技术动态 | 揭开知识库问答 KB-QA 的面纱 6 · 深度学习中篇

​作者,四川大学博士生,刘大一恒。本文已经获得 ChatbotMagazine 公众号授权。
内容速览
☛ 语义解析方法的再思考
☛ 什么是查询图
☛ 查询图的阶段生成
☛ 各阶段的特征
☛ 实验分析与总结
在上期,我们介绍了深度学习对传统向量建模KB-QA方法进行提升的一篇代表论文,可以看出它的效果击败了当时所有的传统方法。本期,我们将以深度学习提升语义解析方法的一篇代表作为例,作为深度学习篇的中篇,为大家进一步揭开知识库问答的面纱。

继续阅读“技术动态 | 揭开知识库问答 KB-QA 的面纱 6 · 深度学习中篇”