技术动态 | 藏经阁计划发布一年,阿里知识引擎有哪些技术突破?

 

本文转载自公众号:阿里技术

导读:2018年4月阿里巴巴业务平台事业部——知识图谱团队联合清华大学、浙江大学、中科院自动化所、中科院软件所、苏州大学等五家机构,联合发布藏经阁(知识引擎)研究计划。

藏经阁计划依赖阿里强大的计算能力(例如Igraph图数据库),和先进的机器学习算法(例如PAI平台)。计划发布一年以来,阿里知识图谱团队有哪些技术突破?今天一起来了解。

继续阅读“技术动态 | 藏经阁计划发布一年,阿里知识引擎有哪些技术突破?”

征稿通知 | 2019 年全国知识图谱与语义计算大会(CCKS2019)

 

2019年全国知识图谱与语义计算大会

China Conference on Knowledge Graph and Semantic Computing (CCKS 2019)

2019年8月24日-27日,杭州

征稿截止: 2019年5月18日

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会组织和承办。全国知识图谱与语义计算大会是两个全国性会议的合并:中文知识图谱研讨会 the Chinese Knowledge Graph Symposium (CKGS) 和中国语义互联网与Web科学大会 Chinese Semantic Web and Web Science Conference (CSWS)。CCKS2016 (www.ccks2016.cn)、CCKS2017 (www.ccks2017.com) 和CCKS2018 (www.ccks2018.cn)  分别在北京、成都和天津举办。CCKS2018 吸引了800余名来自学术界和工业界的学者和研究人员参加。全国知识图谱与语义计算大会已经成为国内知识图谱、语义技术、链接数据等领域的核心会议,聚集了知识表示、自然语言理解、知识获取、智能问答、链接数据、图数据库、图计算、自动推理等相关技术领域的学者和研究人员。2019 年全国知识图谱和语义计算大会 (www.ccks2019.cn) 将于2019年8月24日至8月27日在杭州召开。

2019 年全国知识图谱与语义计算大会的主题是“知识智能”,旨在探讨大数据环境下语言理解、知识获取与智能服务的关键技术和应用。会议将包括学术讲习班、工业界论坛、评测与竞赛、知识图谱顶会回顾、大会特邀报告及学术论文等环节。大会将邀请国内外知名学者讲授相关领域的最新进展、发展趋势和实战经验,工业界论坛将邀请产业界的主要研发人员分享经验,促进产学研合作。

大会诚挚邀请相关领域的研究者投审英文和中文论文。长文投稿不能超过12页,短文不能超过6页。投稿论文需使用 Springer 的 LNCS 模板(中英文使用相同模板): http://www.springer.com/gp/computer-science/lncs/conference-proceedings-guidelines(Word模板下载地址;Latex模板下载地址)。CCKS2019英文论文将被Springer出版的论文集收录,中文论文将被推荐到中国科学、中文信息学报、模式识别与人工智能学报等期刊发表。

投稿论文要求论文工作是未经发表的研究成果,通过会议论文网站提交: https://easychair.org/conferences/?conf=ccks2019。论文主题包括(但不限于):

 

知识表示与推理

·知识表示与本体建模

·知识表示学习

·本体重用与演化

·本体映射、融合与对齐

·本体评估

·知识推理

·知识库补全

 

知识获取与知识图谱构建

·开放知识抽取

·众包知识工程与协同知识获取

·人机协同知识库构建

·维基数据的知识获取

·自动化知识库构建工具、语言与系统

·基于监督学习/非监督学习的知识获取

·半监督学习/远程监督学习与文本抽取

 

链接数据、知识融合和知识图谱存储管理

·实体识别、实体消解与实体链接

·术语映射与集成

·异构知识库集成

·异构知识链接与集成

·基于本体的数据集成

·知识查询与搜索

·弹性知识存储与分布式计算

·图数据库

 

自然语言理解、语义计算和知识图谱挖掘

·文本理解

·机器阅读Machine reading

·语义相似度/相关度计算

·同义挖掘

 

知识图谱应用

·知识图谱可视化

·语义搜索

·基于知识的问答系统

·智能个人助理系统

·基于知识的自然语言/语音/图像/视频语义分析

·智能推荐

 

重要日期(tentative)

·摘要提交:2019年5月10日 (23:59, 北京时间)

·全文提交:2019年5月18日 (23:59, 北京时间)

·审稿结果通知: 2019年7月1日

·正式版本提交: 2019年7月15日

·会议日期: 2019年8月24日—27日

主办:中国中文信息学会语言与知识计算专业委员会

承办: 浙江大学

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

 

研讨会 | 认知计算是下一代计算范式?CCFTF12 期研讨会邀您一起探讨!

认知计算是下一代计算范式。认知系统会从自身与数据、与人的交互中学习,不断自我提高,从而随着时间推移变得更加智能。认知技术会融入许多IT解决方案,赋予它们一种类人的“思考能力”。CCFTF12期研讨会期待和业界的“探索者们”一起探讨认知计算。

◆ ◆ ◆ ◆

“技术团队自己的顶级交流平台”

中国计算机学会技术前线研讨会

CCF TF第12期

主题 语言认知与知识计算

2018年09月16日

上海·建国宾馆四层九州A厅

◆ ◆ ◆ ◆

人机自然语言认知涉及到语法、语义、语用等三个层面,越往后越难。为了推动语言认知与知识计算的发展,不仅需要引入自然语言理解、认知语言学、心理语言学、社会语言学等多学科的综合参与,更需要引入知识图谱技术对信息进行结构化、语义化和智能化的处理与应用。

认知计算是下一代计算范式。认知系统会从自身与数据、与人的交互中学习,不断自我提高,从而随着时间推移变得更加智能。认知技术会融入许多IT解决方案,赋予它们一种类人的“思考能力”。这些新功能将支持人类完成以前无法完成的很多事情,比如更深入地理解世界的运转方式、预测行为的后果并制定更好的决策等。另据IDC预测,到2020年,50%的商业分析软件将包含基于认知计算功能的分析工具,同时知识认知服务将嵌入新的应用之中。

所以我们不禁好奇,语言认知与知识计算时代还将创造出怎样的奇迹?还会带给我们怎样的惊喜?CCFTF12期研讨会期待和业界的“探索者们”一起探讨这些问题。

会议主席

王昊奋

王昊奋,上海乐言信息科技有限公司CTO,中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、中文信息学会语言与知识计算委员会副秘书长,共发表80余篇高水平论文,在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

特邀讲师

云知声AI Labs

资深技术专家

刘升平

主题报告一:知性会话——基于知识图谱的人机对话系统方法与实践

主题简介:人机对话系统,或者会话交互,有望成为物联网时代的主要交互方式。而语言的理解与表达和知识是密切相关的,知识图谱作为一种大规模知识的表示形式,在人机对话系统中各模块都有重要的应用。而知性对话,则是以知识图谱为核心的人机会话交互服务。本次报告介绍了知性会话的架构和关键技术,并结合工业级的人机对话系统实践经验,阐述了知识图谱在人机对话系统的核心模块,包括口语理解,自然应答生成,聊天,问答,主动交互等方面的应用。

个人简介:刘升平,前IBM中国研究院资深研究员,中文信息学会语言与知识计算专委会,医疗健康与生物信息处理专委会委员。2005年获得北京大学数学学院信息科学系博士。曾在语义网,机器学习、信息检索,医学信息学等领域发表过20多篇论文。在IBM中国研究院信息与知识组工作期间,多次获得过IBM研究成就奖。目前在云知声领导NLP和智慧医疗团队,主要从事要从事自然语言理解和生成,人机对话系统,聊天机器人,知识图谱,临床辅助诊断等研发工作。

阿里巴巴集团机器智能技术实验室资深算法专家

陈博兴

主题报告二:阿里机器翻译——场景、挑战与最新技术

主题简介:在这个报告中,我们介绍机器翻译技术在跨境电商领域的应用。具体内容包括:机器翻译在跨境电商领域的应用场景、面临的挑战和我们在数据收集、模型选择和工程架构上采取的策略;以及为了改善翻译性能和提高训练和翻译效率我们采用的一些技术,包括翻译干预、词尾预测、以及分布式训练等等。最后介绍阿里巴巴机器翻译的一些创新研究,以及采用这些研究成果在国际评测中取得的世界一流成绩。

个人简介:陈博兴,阿里巴巴集团机器智能技术实验室资深算法专家。他的研究方向是机器翻译,自然语言处理和机器学习。在加入阿里之前,他是加拿大国家研究委员会(NRC)的终身研究员,再之前是新加坡信息与通信研究所的研究员,意大利FBK-IRST和法国格勒诺布尔大学的博士后。他本科毕业于北京大学,博士毕业于中国科学院。他和同事合作先后发表了50多篇会议和期刊论文,获得过ACL 2013的最佳论文奖提名和MT Summit 2013的最佳论文奖;他长期担任NLP领域所有顶级会议和期刊的审稿人或程序委员会成员。他领导的团队先后在各种机器翻译评测中取得优异成绩,获得了WMT 2018五个语向的第一名,WMT 2017俄语到英语第一名,NIST 2012机器翻译中文到英文第一名,IWSLT 2007口语机器翻译比赛中文到英文第一名,和IWSLT 2005比赛中文到英文和日语到英语第一名等等。

小米AI Lab智能问答

技术总监

刘作鹏

主题报告三:小米智能问答成长之路

主题简介:小米的智能问答服务从一个原型系统开始,经过一年多的持续演进,总结出一套面向变化的、易扩展的系统架构,很好地应对了知识规模指数级扩大、用户请求急剧增长、技术复杂度迅速提升等挑战。通过引入知识图谱和机器学习相关技术,明显提升了知识构建、问题理解、答案匹配等关键环节的效果。目前小米的智能问答分三个子系统 ,分别基于KBQA、FAQ 问答和阅读理解技术构建而成,三个子系统相互补充,也都在迅速地进化的过程中。

个人简介:刘作鹏,小米AI Lab智能问答技术总监,有10多年人工智能相关工作经验。耗时一年多,从零开始为小米搭建出知识问答、知识图谱、智能客服三个系统,核心指标国内领先。2009年到2015年,任职于雅虎全球(北京)研发中心,作为雅虎&微软搜索联盟技术负责人,所承担的项目曾为雅虎带来数十亿美金的收入增长。在百度工作时间,设计并实现了凤巢的广告选择平台,成为了国内第一个日请求数突破20亿的互联网服务。

平安医疗科技研究院医疗文本处理团队负责人

倪渊

主题报告四:自然语言处理在医疗领域的应用

主题简介:医疗领域有大量需要自然语言交互的工作,耗费了大量的人力。比如诊前对于患者就诊科室以及就医流程相关问题,医院往往需要有专业的人员在门诊大厅,回答相关问题;诊后对于患者的健康咨询和随访,需要家庭医生定期上门或者电话来进行。在中国医生资源缺乏的情况下,导致医生的工作负担重而患者的管理质量低。平安医疗科技通过构建医疗知识图谱来打造医疗人工智能的大脑,并通过对话问答技术,来和患者智能交互,为患者提供智能分诊/导诊服务以及智能患教问答和随访服务。本次报告将主要介绍平安如何运用自然语言处理技术来打造智能的患者服务。

个人简介:倪渊,博士。2003年毕业于复旦大学计算机科学与技术专业,2007年毕业于新加坡国立大学计算机系。之后加入IBM中国研究院,从事自然语言处理,知识图谱等相关领域的研究。在IBM期间,倪渊参与过著名人工智能项目沃森机器人的开发。2018年,倪渊加入平安医疗科技研究院,带领医疗文本处理团队。倪渊博士在著名国际会议,比如SIGMOD, WWW, ISWC等上,发表过20多篇文本,并且获得20多项国际专利。

文因互联 CEO,联合创始人

鲍捷

主题报告五:在知识图谱工程中如何进行规则建模

主题简介:知识图谱技术侧重于实例结构化数据的提取和建模,但是得到知识图谱后,为实现后续的应用如处理自动化,规则建模是不可缺少的。本讲座介绍知识图谱上规则建模的实践方法,关注如何全周期控制成本,如规则建立的成本,规则管理的成本,规则推理的成本,规则调试的成本等。针对金融监管、贷款风控,投资研究等,分别给出规则建模的具体案例。

个人简介:鲍捷,博士,文因互联 CEO,联合创始人。他曾是三星美国研发中心研究员,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员,以及雷神 BBN 技术公司访问科学家。2007 年,他于爱荷华州立大学(Iowa State University)获得博士学位。他的研究领域涉及人工智能很多方向,如自然语言处理,语义网,机器学习,描述逻辑,信息论,神经网络,图像识别等。鲍捷博士已经发表 70 多篇论文。他曾是 W3C OWL(Web本体语言)工作组成员,在此期间,合作撰写了 OWL2 的 W3C 规范文档。他先后参与组织了 50 多场国际学术会议和学术研讨会。他是中国中文信息学会语言与知识计算专委会委员,W3C顾问委员会委员,中国计算机协会会刊编委,中文开放知识图谱联盟(OpenKG)发起人之一。

特邀嘉宾

浙江大学教授、博士生导师

陈华钧

个人简介:陈华钧,浙江大学计算机科学与技术学院教授、博士生导师。主要研究方向为知识图谱、自然语言处理、大数据与知识发现、生物医学信息等。浙江省大数据智能计算重点实验室副主任、中文开放知识图谱OpenKG发起人。在IJCAI, WWW, KR, ISWC, EMNLP, AAAI/IAAI, ICDE, IEEE Magazine on Computational Intelligence, IEEE Intelligent System,  TKDE, Briefings in Bioinforamtics, BMC Bioinformatics 等国际顶级会议或期刊上发表多篇论文,并曾获国际语义网会议ISWC最佳论文奖。作为主要参与者,获得教育部技术发明一等奖、国家科技进步二等奖等奖励。

东南大学教授,博士生导师

漆桂林

个人简介:漆桂林,东南大学教授、博士生导师,获得“江苏省六大人才高峰”资助。2006 年从英国贝尔法斯特女皇大学获得计算机科学博士学位。2006 年8 月至2009 年8 月,在德国Karlsruhe 大学AIFB 研究所从事博士后研究。是开放知识图谱联盟openKG的联合创始人之一。是Data Intelligence期刊执行主编,并且担任语义Web权威期刊Journal of Web Semantics的副主编和Semantic Web Journal的编委。是新华社中国经济信息社特约专家。发表高质量学术论文150余篇,获得多项发明专利授权。在知识图谱和知识工程、大数据语义分析、不确定性推理等领域有将近20年的研究和产业化经验。

时间:2018年09月16日

地点:上海市徐汇区漕溪北路439号上海建国宾馆四层九州A厅

日程安排

09:00 – 09:10    开场致辞

09:10 – 10:30    鲍捷-文因互联 CEO,联合创始人

在知识图谱工程中如何进行规则建模

10:30 – 10:40    Break

10:40 – 12:00    陈博兴-阿里巴巴集团机器智能技术实验室的资深算法专家

阿里机器翻译——场景、挑战与最新技术

12:00 – 13:00     午餐

13:00 – 14:20     刘作鹏-小米AI Lab智能问答技术总监

小米智能问答成长之路

14:20 – 14:30     Break

14:30 – 15:50     倪渊-平安医疗科技研究院医疗文本处理团队负责人

自然语言处理在医疗领域的应用

15:50 – 16:00     Break

16:00 – 17:20     刘升平-云知声AI Labs资深技术专家

知性会话——基于知识图谱的人机对话系统方法与实践

17:20 – 17:30     Break

17:30 – 18:00     Panel  探讨语言认知与知识计算之机遇与挑战

缴费标准

申请团体入会,享受免费名额,咨询电话166-0111-0821

CCF会员参会价:1000元

非CCF会员参会并入会价:1300元(会员资格有效期至2019年底)

学生非CCF会员参会并入会价:1050元(会员资格有效期至2019年底)

非CCF会员价:1700元

参会方式

扫描二维码网上报名:

会议联系方式

联系人:李逸舟

电话:010-6260 1379-20/166-0111-0821

邮箱:tf@ccf.org.cn

中国计算机学会   

微信号:ccfvoice

长按识别二维码关注我们


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

 

刘知远 | 语义表示学习

 

本文转载自公众号:人工智能图灵。

刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011年获得清华大学博士学位,已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文60余篇,Google Scholar统计引用超过2700次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI期刊Frontiers of Computer Science青年编委,ACL、COLING、IJCNLP领域主席。

继续阅读“刘知远 | 语义表示学习”

胡伟 | 面向多实体人机协作消解的对比表生成自动化方法

 

众包实体消解

实体消解(Entity Resolution,简称ER)旨在发现不同知识图谱中指称真实世界相同对象的实体。众包实体消解(Crowd ER)在使用机器的基础上,还使用人来完成实体消解任务。众包实体消解的一个常见流程如下图所示:

(Waldo: AnAdaptive Human Interface for Crowd Entity Resolution. SIGMOD 2017)

 

在众包实体消解中,存在一系列关键问题亟待解决,包括:1)如何呈现一个实体消解任务?2)如何选择合适的人来完成任务?3)如何在给定预算限制下挑选任务?等等。论文作者发现,当前研究很少关注第1个问题,即如何通过呈现一些关键信息(例如实体的重要属性和取值)来帮助单个人更高效和精准地完成一个实体消解任务。

 

一个例子

论文作者关注多实体消解任务(multi-entityresolution,简称MER),下图展示了一个包含3个实体的多实体消解任务,它们拥有了相似的属性和取值,有待人来完成消解。

相关工作

  • 基于列表的多实体消解任务呈现方式,类似于传统搜索引擎。
  • 基于成对的多实体消解任务呈现方式,每次仅比较两个实体并对齐它们间的相似属性。

考虑到属性和取值的数量可能很多,上述两类方法常通过生成摘要来提高人的消解效率。然而,这两类方法对于多实体消解任务而言,也均存在一些不足。例如,由于缺乏直接对比,基于列表的方法需要人在心里记录并比较不同实体;又如,基于成对的方法虽然能使人更加专注两个实体的比较,但是可伸缩性差。更为重要的是,这两类方法在形成列表或成对的过程中,会丢失实体消解结果间的传递性和聚类性等。

 

本文方法

论文作者提出了一种基于对比表(comparativetable)的多实体消解任务呈现方法,将实体和重要属性分别组成表的行和列头,并将重要取值填入表单元中。拟解决的关键问题是实体的属性和取值的异构性及规模性与有限的表格呈现空间之间的矛盾。方法框架如下图所示,包括3个主要步骤:

  1. 全体属性匹配,包括属性间相似度计算和属性团生成两个子步骤。
  2. 优良性评估,考虑了属性团的判别性、丰富性、语义性和多样性4个特征。
  3. 对比表生成,包括属性团的选择和取值的选择两个子步骤。

 

下图展示了根据上述例子生成的一个多实体消解任务对比表。

实验结果

论文作者从10个流行领域各选取了25个DBpedia实体作为种子,并通过维基百科消歧页面为每个种子实体随机选取2 ~ 4个Freebase、Wikidata和YAGO实体,再从中随机选择出10个实体构成一个多实体消解任务。共计250个任务,2500个实体,指称804个真实世界对象。

实验从3个方面检验了基于对比表的方法有效性,包括:1)全体属性匹配的准确性;2)属性团排序的有效性;3)通过雇佣60位研究生进行实操,从效率、精度和打分3个方面与基于列表和基于成对的两个代表性方法进行了比较。

 

[1] Jiacheng Huang, Wei Hu*, Haoxuan Li, Yuzhong Qu. Automated Comparative Table Generation for Facilitating Human Intervention in Multi-Entity Resolution. In: ACM SIGIR Conference on Research and Development in Information Retrieval. 585–594, 2018

— End —

实验室介绍:南京大学万维网软件(Websoft)研究组在瞿裕忠教授的带领下,长期从事知识图谱(语义网)及相关技术的研发,研究组成员包括胡伟副教授、程龚副教授以及30余位博士和和硕士研究生,近期的研究方向主要包括:智能问答、知识融合和语义搜索。

联系方式:胡伟,whu@nju.edu.cn,微信号:whu1982

网站:http://ws.nju.edu.cn

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

 

会议 | ESWC2018 见闻

本文转载自公众号:南大Websoft 。

ESWC2018于2018年6月2日在希腊克里特岛上的伊拉克利翁举行。会议包括两天的前会(workshops, tutorials) 和三天的正会,参会人数约300人。

Keynotes

Keynote1: Structural Summarization of Semantic Graphs, by Ioana Manolescu (INRIA, Paris-Saclay, Paris, France)

面对规模较大、数据异构、暗含推理的RDF图,如何产生摘要以展示其中频繁出现的结构?

讲者分析了一些基于频繁模式和统计数据的相关工作,并介绍了一种先挖掘数据频繁模式,再考虑类型结构的方法。同时报告者还通过该摘要方法发现了存在于当前知识库中的一些噪音数据,比如DBpedia中存在一些实体的birthplace是自己。

Keynote2: Knowledge Representation and the Semantic Web – an Ontologician´s View, by Sebastian Rudolph (TU Dresden, Germany)

该报告主要包括两部分内容:使用一些例子来讲述逻辑对于语义网的作用;讲述基于逻辑的知识表示的变化以及面对的主要问题。

上图展示了逻辑在问答中的作用。如果我们要查询知识库中所有的人,那么逻辑推理能够给我们很大帮助,例如利用subClassOf/subPropertyOf推理、domain/range推理等等。

基于逻辑的知识表示当前面对的问题主要包括两点:(1)数据中的噪音,可能引入矛盾的知识。由于推理规则 A 和 非A 能够推出任意 B,因此小的错误可能会对逻辑知识系统带来很大的灾难。目前常见的做法是采用fuzzy logic或者probabilistic logics(Markov logic)等等。(2)数据的动态性,目前知识是持久存储的,而网络上信息的更新速度远大于知识的更新速度。因此需要研究实时(real-time)的知识表示方法,但目前的自动索引和推理技术不能满足需求。

下图展示了讲者在总结部分对逻辑学家和其他语义网工作者的一些提示。

Keynote3: How to Make, Grow and Sell a Semantic Web Start-up, by Milan Stankovic (Sépage, Paris, France)

该讲者主要讲述了其使用语义网技术的旅游应用的创业经历(如下图所示),刚开始13年他在一次会议上作报告时获得了投资,后艰难发展迎来第一个客户,…,最终17年初创公司成功被大企业收购

该讲者还结合他自己的经历提出了一些至理名言,例如:

Success is getting what you want and failing at everything else.

If you are too busy, there must be something that you are doing wrong.

There is only one viable start-up ideology: common sense.

My paper

在这次大会上我报告了关于地理高考选择题求解方法的文章Answering Multiple-choice Questions in Geographical Gaokao with a Concept Graph.该工作包括从教材教辅表格构建地理概念图谱(刻画概念之间的关系和每个概念的相关文本描述),并采用搜索特定类型的路径的方式回答地理选择题。由于我的报告被安排在了地理相关资源的会场上,因此听众较少。听众主要关心的内容是,地理知识图谱构建方法如何推广到其他学科/领域。同时,有听者询问我们的问答方法是否受限于概念图谱的质量和规模,对于概念图谱目前无法回答的问题是否有尝试一些其他方法。

Related papers

Marco Avvenuti, Stefano Cresci, Leonardo Nizzoli and Maurizio Tesconi. Geoparsing and Geotagging with Machine Learning on top of Linked Data. (best paper candidate)

文章提出了一种使用多个知识源来发现、链接推特中的地理实体的方法。与传统方法不同的是,该方法同时考虑在多个知识库上进行地理实体的发现和链接,之后通过投票的机制来确定正确的实体。对于投票方法可能出现的问题(多数链接是错误的情况),该方法增加了一个使用监督学习的过滤方法,使用文本、链接、来源三个方面的特征,来确定每个链接的置信度。实验上,该方法在英文推特上结果几乎翻倍(30%+提升到60%+),在印第安语上从60%+提升至80%+。

Tu Nguyen and Wolfgang Nejdl. Multiple Models for Recommending Temporal Aspects of Entities.

该文章主要场景是,当用户搜索一个实体时(事件),是根据当前时间来推荐实体的不同方面。例如,在总统大选出结果之前,人们搜索大选更关注竞选人信息、竞选的预测;而当竞选结束后,用户再搜索大选一般需要的是大选的结果(虽然竞选预测等信息依然存在在网上)。文章的主要方法是对于搜索的目标实体分类,学习其周期性特征、趋势性特征、自相关特征、互相关特征,从而对于一个新的实体和搜索发生的时间做出预测。

Hamid Zafar, Giulio Napolitano and Jens Lehmann. Formal Query Generation for Question Answering over Knowledge Bases.

文章提出了一种KBQA方法。首先他假设问句中的实体、属性和答案在知识库上能够构成一个通路,任意两个实体之间的距离不超过两步。在找出所有候选通路之后,该方法将每条候选通路和问句的依存树通过一个预训练的Tree-LSTM转为向量,然后计算相似度,相似度高的选为生成的结构化查询。

Challenges, Tutorials, Awards

ESWC上举行了 Scalable Question Answering Challenge, 得奖队伍是 Dennis Diefenbach, Kamal Singh and Pierre Maret 的系统 WDAqua-core1.

Tutorial 部分How to build a QA system overnight和我们较为相关,介绍了QA的基本知识,基于 Semantic Parsing 的问答方法,基于Deep Learning的问答方法,并且包括一些编程实战。相关PPT和代码参见https://github.com/AskNowQA/QA-Tutorial

Best PhD Symposium颁发给Lucia Sicilian: Question Answering over Knowledge Bases.

Best Research Paper颁发给Alieh Saeedi, Eric Peukert and Erhard Rahm: Using Link Features for Entity Clustering in Knowledge Graphs.

Best Resource Paper颁发给Wouter Beek, Joe Raad, Jan Wielemaker and Frank van Harmelen. sameAs.cc: The Closure of 500M owl:sameAs Statements.

Best Inuse Paper颁发给Oktie Hassanzadeh, Shari Trewin and Alfio Massimiliano Gliozzo. Semantic Concept Discovery Over Event Databases.

ESWC19将在Portoroz举行。

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。