会议 | ESWC2018 见闻

本文转载自公众号:南大Websoft 。

ESWC2018于2018年6月2日在希腊克里特岛上的伊拉克利翁举行。会议包括两天的前会(workshops, tutorials) 和三天的正会,参会人数约300人。

Keynotes

Keynote1: Structural Summarization of Semantic Graphs, by Ioana Manolescu (INRIA, Paris-Saclay, Paris, France)

面对规模较大、数据异构、暗含推理的RDF图,如何产生摘要以展示其中频繁出现的结构?

讲者分析了一些基于频繁模式和统计数据的相关工作,并介绍了一种先挖掘数据频繁模式,再考虑类型结构的方法。同时报告者还通过该摘要方法发现了存在于当前知识库中的一些噪音数据,比如DBpedia中存在一些实体的birthplace是自己。

Keynote2: Knowledge Representation and the Semantic Web – an Ontologician´s View, by Sebastian Rudolph (TU Dresden, Germany)

该报告主要包括两部分内容:使用一些例子来讲述逻辑对于语义网的作用;讲述基于逻辑的知识表示的变化以及面对的主要问题。

上图展示了逻辑在问答中的作用。如果我们要查询知识库中所有的人,那么逻辑推理能够给我们很大帮助,例如利用subClassOf/subPropertyOf推理、domain/range推理等等。

基于逻辑的知识表示当前面对的问题主要包括两点:(1)数据中的噪音,可能引入矛盾的知识。由于推理规则 A 和 非A 能够推出任意 B,因此小的错误可能会对逻辑知识系统带来很大的灾难。目前常见的做法是采用fuzzy logic或者probabilistic logics(Markov logic)等等。(2)数据的动态性,目前知识是持久存储的,而网络上信息的更新速度远大于知识的更新速度。因此需要研究实时(real-time)的知识表示方法,但目前的自动索引和推理技术不能满足需求。

下图展示了讲者在总结部分对逻辑学家和其他语义网工作者的一些提示。

Keynote3: How to Make, Grow and Sell a Semantic Web Start-up, by Milan Stankovic (Sépage, Paris, France)

该讲者主要讲述了其使用语义网技术的旅游应用的创业经历(如下图所示),刚开始13年他在一次会议上作报告时获得了投资,后艰难发展迎来第一个客户,…,最终17年初创公司成功被大企业收购

该讲者还结合他自己的经历提出了一些至理名言,例如:

Success is getting what you want and failing at everything else.

If you are too busy, there must be something that you are doing wrong.

There is only one viable start-up ideology: common sense.

My paper

在这次大会上我报告了关于地理高考选择题求解方法的文章Answering Multiple-choice Questions in Geographical Gaokao with a Concept Graph.该工作包括从教材教辅表格构建地理概念图谱(刻画概念之间的关系和每个概念的相关文本描述),并采用搜索特定类型的路径的方式回答地理选择题。由于我的报告被安排在了地理相关资源的会场上,因此听众较少。听众主要关心的内容是,地理知识图谱构建方法如何推广到其他学科/领域。同时,有听者询问我们的问答方法是否受限于概念图谱的质量和规模,对于概念图谱目前无法回答的问题是否有尝试一些其他方法。

Related papers

Marco Avvenuti, Stefano Cresci, Leonardo Nizzoli and Maurizio Tesconi. Geoparsing and Geotagging with Machine Learning on top of Linked Data. (best paper candidate)

文章提出了一种使用多个知识源来发现、链接推特中的地理实体的方法。与传统方法不同的是,该方法同时考虑在多个知识库上进行地理实体的发现和链接,之后通过投票的机制来确定正确的实体。对于投票方法可能出现的问题(多数链接是错误的情况),该方法增加了一个使用监督学习的过滤方法,使用文本、链接、来源三个方面的特征,来确定每个链接的置信度。实验上,该方法在英文推特上结果几乎翻倍(30%+提升到60%+),在印第安语上从60%+提升至80%+。

Tu Nguyen and Wolfgang Nejdl. Multiple Models for Recommending Temporal Aspects of Entities.

该文章主要场景是,当用户搜索一个实体时(事件),是根据当前时间来推荐实体的不同方面。例如,在总统大选出结果之前,人们搜索大选更关注竞选人信息、竞选的预测;而当竞选结束后,用户再搜索大选一般需要的是大选的结果(虽然竞选预测等信息依然存在在网上)。文章的主要方法是对于搜索的目标实体分类,学习其周期性特征、趋势性特征、自相关特征、互相关特征,从而对于一个新的实体和搜索发生的时间做出预测。

Hamid Zafar, Giulio Napolitano and Jens Lehmann. Formal Query Generation for Question Answering over Knowledge Bases.

文章提出了一种KBQA方法。首先他假设问句中的实体、属性和答案在知识库上能够构成一个通路,任意两个实体之间的距离不超过两步。在找出所有候选通路之后,该方法将每条候选通路和问句的依存树通过一个预训练的Tree-LSTM转为向量,然后计算相似度,相似度高的选为生成的结构化查询。

Challenges, Tutorials, Awards

ESWC上举行了 Scalable Question Answering Challenge, 得奖队伍是 Dennis Diefenbach, Kamal Singh and Pierre Maret 的系统 WDAqua-core1.

Tutorial 部分How to build a QA system overnight和我们较为相关,介绍了QA的基本知识,基于 Semantic Parsing 的问答方法,基于Deep Learning的问答方法,并且包括一些编程实战。相关PPT和代码参见https://github.com/AskNowQA/QA-Tutorial

Best PhD Symposium颁发给Lucia Sicilian: Question Answering over Knowledge Bases.

Best Research Paper颁发给Alieh Saeedi, Eric Peukert and Erhard Rahm: Using Link Features for Entity Clustering in Knowledge Graphs.

Best Resource Paper颁发给Wouter Beek, Joe Raad, Jan Wielemaker and Frank van Harmelen. sameAs.cc: The Closure of 500M owl:sameAs Statements.

Best Inuse Paper颁发给Oktie Hassanzadeh, Shari Trewin and Alfio Massimiliano Gliozzo. Semantic Concept Discovery Over Event Databases.

ESWC19将在Portoroz举行。

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注