研讨会 | 认知计算是下一代计算范式?CCFTF12 期研讨会邀您一起探讨!

认知计算是下一代计算范式。认知系统会从自身与数据、与人的交互中学习,不断自我提高,从而随着时间推移变得更加智能。认知技术会融入许多IT解决方案,赋予它们一种类人的“思考能力”。CCFTF12期研讨会期待和业界的“探索者们”一起探讨认知计算。

◆ ◆ ◆ ◆

“技术团队自己的顶级交流平台”

中国计算机学会技术前线研讨会

CCF TF第12期

主题 语言认知与知识计算

2018年09月16日

上海·建国宾馆四层九州A厅

◆ ◆ ◆ ◆

人机自然语言认知涉及到语法、语义、语用等三个层面,越往后越难。为了推动语言认知与知识计算的发展,不仅需要引入自然语言理解、认知语言学、心理语言学、社会语言学等多学科的综合参与,更需要引入知识图谱技术对信息进行结构化、语义化和智能化的处理与应用。

认知计算是下一代计算范式。认知系统会从自身与数据、与人的交互中学习,不断自我提高,从而随着时间推移变得更加智能。认知技术会融入许多IT解决方案,赋予它们一种类人的“思考能力”。这些新功能将支持人类完成以前无法完成的很多事情,比如更深入地理解世界的运转方式、预测行为的后果并制定更好的决策等。另据IDC预测,到2020年,50%的商业分析软件将包含基于认知计算功能的分析工具,同时知识认知服务将嵌入新的应用之中。

所以我们不禁好奇,语言认知与知识计算时代还将创造出怎样的奇迹?还会带给我们怎样的惊喜?CCFTF12期研讨会期待和业界的“探索者们”一起探讨这些问题。

会议主席

王昊奋

王昊奋,上海乐言信息科技有限公司CTO,中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、中文信息学会语言与知识计算委员会副秘书长,共发表80余篇高水平论文,在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

特邀讲师

云知声AI Labs

资深技术专家

刘升平

主题报告一:知性会话——基于知识图谱的人机对话系统方法与实践

主题简介:人机对话系统,或者会话交互,有望成为物联网时代的主要交互方式。而语言的理解与表达和知识是密切相关的,知识图谱作为一种大规模知识的表示形式,在人机对话系统中各模块都有重要的应用。而知性对话,则是以知识图谱为核心的人机会话交互服务。本次报告介绍了知性会话的架构和关键技术,并结合工业级的人机对话系统实践经验,阐述了知识图谱在人机对话系统的核心模块,包括口语理解,自然应答生成,聊天,问答,主动交互等方面的应用。

个人简介:刘升平,前IBM中国研究院资深研究员,中文信息学会语言与知识计算专委会,医疗健康与生物信息处理专委会委员。2005年获得北京大学数学学院信息科学系博士。曾在语义网,机器学习、信息检索,医学信息学等领域发表过20多篇论文。在IBM中国研究院信息与知识组工作期间,多次获得过IBM研究成就奖。目前在云知声领导NLP和智慧医疗团队,主要从事要从事自然语言理解和生成,人机对话系统,聊天机器人,知识图谱,临床辅助诊断等研发工作。

阿里巴巴集团机器智能技术实验室资深算法专家

陈博兴

主题报告二:阿里机器翻译——场景、挑战与最新技术

主题简介:在这个报告中,我们介绍机器翻译技术在跨境电商领域的应用。具体内容包括:机器翻译在跨境电商领域的应用场景、面临的挑战和我们在数据收集、模型选择和工程架构上采取的策略;以及为了改善翻译性能和提高训练和翻译效率我们采用的一些技术,包括翻译干预、词尾预测、以及分布式训练等等。最后介绍阿里巴巴机器翻译的一些创新研究,以及采用这些研究成果在国际评测中取得的世界一流成绩。

个人简介:陈博兴,阿里巴巴集团机器智能技术实验室资深算法专家。他的研究方向是机器翻译,自然语言处理和机器学习。在加入阿里之前,他是加拿大国家研究委员会(NRC)的终身研究员,再之前是新加坡信息与通信研究所的研究员,意大利FBK-IRST和法国格勒诺布尔大学的博士后。他本科毕业于北京大学,博士毕业于中国科学院。他和同事合作先后发表了50多篇会议和期刊论文,获得过ACL 2013的最佳论文奖提名和MT Summit 2013的最佳论文奖;他长期担任NLP领域所有顶级会议和期刊的审稿人或程序委员会成员。他领导的团队先后在各种机器翻译评测中取得优异成绩,获得了WMT 2018五个语向的第一名,WMT 2017俄语到英语第一名,NIST 2012机器翻译中文到英文第一名,IWSLT 2007口语机器翻译比赛中文到英文第一名,和IWSLT 2005比赛中文到英文和日语到英语第一名等等。

小米AI Lab智能问答

技术总监

刘作鹏

主题报告三:小米智能问答成长之路

主题简介:小米的智能问答服务从一个原型系统开始,经过一年多的持续演进,总结出一套面向变化的、易扩展的系统架构,很好地应对了知识规模指数级扩大、用户请求急剧增长、技术复杂度迅速提升等挑战。通过引入知识图谱和机器学习相关技术,明显提升了知识构建、问题理解、答案匹配等关键环节的效果。目前小米的智能问答分三个子系统 ,分别基于KBQA、FAQ 问答和阅读理解技术构建而成,三个子系统相互补充,也都在迅速地进化的过程中。

个人简介:刘作鹏,小米AI Lab智能问答技术总监,有10多年人工智能相关工作经验。耗时一年多,从零开始为小米搭建出知识问答、知识图谱、智能客服三个系统,核心指标国内领先。2009年到2015年,任职于雅虎全球(北京)研发中心,作为雅虎&微软搜索联盟技术负责人,所承担的项目曾为雅虎带来数十亿美金的收入增长。在百度工作时间,设计并实现了凤巢的广告选择平台,成为了国内第一个日请求数突破20亿的互联网服务。

平安医疗科技研究院医疗文本处理团队负责人

倪渊

主题报告四:自然语言处理在医疗领域的应用

主题简介:医疗领域有大量需要自然语言交互的工作,耗费了大量的人力。比如诊前对于患者就诊科室以及就医流程相关问题,医院往往需要有专业的人员在门诊大厅,回答相关问题;诊后对于患者的健康咨询和随访,需要家庭医生定期上门或者电话来进行。在中国医生资源缺乏的情况下,导致医生的工作负担重而患者的管理质量低。平安医疗科技通过构建医疗知识图谱来打造医疗人工智能的大脑,并通过对话问答技术,来和患者智能交互,为患者提供智能分诊/导诊服务以及智能患教问答和随访服务。本次报告将主要介绍平安如何运用自然语言处理技术来打造智能的患者服务。

个人简介:倪渊,博士。2003年毕业于复旦大学计算机科学与技术专业,2007年毕业于新加坡国立大学计算机系。之后加入IBM中国研究院,从事自然语言处理,知识图谱等相关领域的研究。在IBM期间,倪渊参与过著名人工智能项目沃森机器人的开发。2018年,倪渊加入平安医疗科技研究院,带领医疗文本处理团队。倪渊博士在著名国际会议,比如SIGMOD, WWW, ISWC等上,发表过20多篇文本,并且获得20多项国际专利。

文因互联 CEO,联合创始人

鲍捷

主题报告五:在知识图谱工程中如何进行规则建模

主题简介:知识图谱技术侧重于实例结构化数据的提取和建模,但是得到知识图谱后,为实现后续的应用如处理自动化,规则建模是不可缺少的。本讲座介绍知识图谱上规则建模的实践方法,关注如何全周期控制成本,如规则建立的成本,规则管理的成本,规则推理的成本,规则调试的成本等。针对金融监管、贷款风控,投资研究等,分别给出规则建模的具体案例。

个人简介:鲍捷,博士,文因互联 CEO,联合创始人。他曾是三星美国研发中心研究员,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员,以及雷神 BBN 技术公司访问科学家。2007 年,他于爱荷华州立大学(Iowa State University)获得博士学位。他的研究领域涉及人工智能很多方向,如自然语言处理,语义网,机器学习,描述逻辑,信息论,神经网络,图像识别等。鲍捷博士已经发表 70 多篇论文。他曾是 W3C OWL(Web本体语言)工作组成员,在此期间,合作撰写了 OWL2 的 W3C 规范文档。他先后参与组织了 50 多场国际学术会议和学术研讨会。他是中国中文信息学会语言与知识计算专委会委员,W3C顾问委员会委员,中国计算机协会会刊编委,中文开放知识图谱联盟(OpenKG)发起人之一。

特邀嘉宾

浙江大学教授、博士生导师

陈华钧

个人简介:陈华钧,浙江大学计算机科学与技术学院教授、博士生导师。主要研究方向为知识图谱、自然语言处理、大数据与知识发现、生物医学信息等。浙江省大数据智能计算重点实验室副主任、中文开放知识图谱OpenKG发起人。在IJCAI, WWW, KR, ISWC, EMNLP, AAAI/IAAI, ICDE, IEEE Magazine on Computational Intelligence, IEEE Intelligent System,  TKDE, Briefings in Bioinforamtics, BMC Bioinformatics 等国际顶级会议或期刊上发表多篇论文,并曾获国际语义网会议ISWC最佳论文奖。作为主要参与者,获得教育部技术发明一等奖、国家科技进步二等奖等奖励。

东南大学教授,博士生导师

漆桂林

个人简介:漆桂林,东南大学教授、博士生导师,获得“江苏省六大人才高峰”资助。2006 年从英国贝尔法斯特女皇大学获得计算机科学博士学位。2006 年8 月至2009 年8 月,在德国Karlsruhe 大学AIFB 研究所从事博士后研究。是开放知识图谱联盟openKG的联合创始人之一。是Data Intelligence期刊执行主编,并且担任语义Web权威期刊Journal of Web Semantics的副主编和Semantic Web Journal的编委。是新华社中国经济信息社特约专家。发表高质量学术论文150余篇,获得多项发明专利授权。在知识图谱和知识工程、大数据语义分析、不确定性推理等领域有将近20年的研究和产业化经验。

时间:2018年09月16日

地点:上海市徐汇区漕溪北路439号上海建国宾馆四层九州A厅

日程安排

09:00 – 09:10    开场致辞

09:10 – 10:30    鲍捷-文因互联 CEO,联合创始人

在知识图谱工程中如何进行规则建模

10:30 – 10:40    Break

10:40 – 12:00    陈博兴-阿里巴巴集团机器智能技术实验室的资深算法专家

阿里机器翻译——场景、挑战与最新技术

12:00 – 13:00     午餐

13:00 – 14:20     刘作鹏-小米AI Lab智能问答技术总监

小米智能问答成长之路

14:20 – 14:30     Break

14:30 – 15:50     倪渊-平安医疗科技研究院医疗文本处理团队负责人

自然语言处理在医疗领域的应用

15:50 – 16:00     Break

16:00 – 17:20     刘升平-云知声AI Labs资深技术专家

知性会话——基于知识图谱的人机对话系统方法与实践

17:20 – 17:30     Break

17:30 – 18:00     Panel  探讨语言认知与知识计算之机遇与挑战

缴费标准

申请团体入会,享受免费名额,咨询电话166-0111-0821

CCF会员参会价:1000元

非CCF会员参会并入会价:1300元(会员资格有效期至2019年底)

学生非CCF会员参会并入会价:1050元(会员资格有效期至2019年底)

非CCF会员价:1700元

参会方式

扫描二维码网上报名:

会议联系方式

联系人:李逸舟

电话:010-6260 1379-20/166-0111-0821

邮箱:tf@ccf.org.cn

中国计算机学会   

微信号:ccfvoice

长按识别二维码关注我们


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

 

刘知远 | 语义表示学习

 

本文转载自公众号:人工智能图灵。

刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011年获得清华大学博士学位,已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文60余篇,Google Scholar统计引用超过2700次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI期刊Frontiers of Computer Science青年编委,ACL、COLING、IJCNLP领域主席。

继续阅读“刘知远 | 语义表示学习”

胡伟 | 面向多实体人机协作消解的对比表生成自动化方法

 

众包实体消解

实体消解(Entity Resolution,简称ER)旨在发现不同知识图谱中指称真实世界相同对象的实体。众包实体消解(Crowd ER)在使用机器的基础上,还使用人来完成实体消解任务。众包实体消解的一个常见流程如下图所示:

(Waldo: AnAdaptive Human Interface for Crowd Entity Resolution. SIGMOD 2017)

 

在众包实体消解中,存在一系列关键问题亟待解决,包括:1)如何呈现一个实体消解任务?2)如何选择合适的人来完成任务?3)如何在给定预算限制下挑选任务?等等。论文作者发现,当前研究很少关注第1个问题,即如何通过呈现一些关键信息(例如实体的重要属性和取值)来帮助单个人更高效和精准地完成一个实体消解任务。

 

一个例子

论文作者关注多实体消解任务(multi-entityresolution,简称MER),下图展示了一个包含3个实体的多实体消解任务,它们拥有了相似的属性和取值,有待人来完成消解。

相关工作

  • 基于列表的多实体消解任务呈现方式,类似于传统搜索引擎。
  • 基于成对的多实体消解任务呈现方式,每次仅比较两个实体并对齐它们间的相似属性。

考虑到属性和取值的数量可能很多,上述两类方法常通过生成摘要来提高人的消解效率。然而,这两类方法对于多实体消解任务而言,也均存在一些不足。例如,由于缺乏直接对比,基于列表的方法需要人在心里记录并比较不同实体;又如,基于成对的方法虽然能使人更加专注两个实体的比较,但是可伸缩性差。更为重要的是,这两类方法在形成列表或成对的过程中,会丢失实体消解结果间的传递性和聚类性等。

 

本文方法

论文作者提出了一种基于对比表(comparativetable)的多实体消解任务呈现方法,将实体和重要属性分别组成表的行和列头,并将重要取值填入表单元中。拟解决的关键问题是实体的属性和取值的异构性及规模性与有限的表格呈现空间之间的矛盾。方法框架如下图所示,包括3个主要步骤:

  1. 全体属性匹配,包括属性间相似度计算和属性团生成两个子步骤。
  2. 优良性评估,考虑了属性团的判别性、丰富性、语义性和多样性4个特征。
  3. 对比表生成,包括属性团的选择和取值的选择两个子步骤。

 

下图展示了根据上述例子生成的一个多实体消解任务对比表。

实验结果

论文作者从10个流行领域各选取了25个DBpedia实体作为种子,并通过维基百科消歧页面为每个种子实体随机选取2 ~ 4个Freebase、Wikidata和YAGO实体,再从中随机选择出10个实体构成一个多实体消解任务。共计250个任务,2500个实体,指称804个真实世界对象。

实验从3个方面检验了基于对比表的方法有效性,包括:1)全体属性匹配的准确性;2)属性团排序的有效性;3)通过雇佣60位研究生进行实操,从效率、精度和打分3个方面与基于列表和基于成对的两个代表性方法进行了比较。

 

[1] Jiacheng Huang, Wei Hu*, Haoxuan Li, Yuzhong Qu. Automated Comparative Table Generation for Facilitating Human Intervention in Multi-Entity Resolution. In: ACM SIGIR Conference on Research and Development in Information Retrieval. 585–594, 2018

— End —

实验室介绍:南京大学万维网软件(Websoft)研究组在瞿裕忠教授的带领下,长期从事知识图谱(语义网)及相关技术的研发,研究组成员包括胡伟副教授、程龚副教授以及30余位博士和和硕士研究生,近期的研究方向主要包括:智能问答、知识融合和语义搜索。

联系方式:胡伟,whu@nju.edu.cn,微信号:whu1982

网站:http://ws.nju.edu.cn

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

 

会议 | ESWC2018 见闻

本文转载自公众号:南大Websoft 。

ESWC2018于2018年6月2日在希腊克里特岛上的伊拉克利翁举行。会议包括两天的前会(workshops, tutorials) 和三天的正会,参会人数约300人。

Keynotes

Keynote1: Structural Summarization of Semantic Graphs, by Ioana Manolescu (INRIA, Paris-Saclay, Paris, France)

面对规模较大、数据异构、暗含推理的RDF图,如何产生摘要以展示其中频繁出现的结构?

讲者分析了一些基于频繁模式和统计数据的相关工作,并介绍了一种先挖掘数据频繁模式,再考虑类型结构的方法。同时报告者还通过该摘要方法发现了存在于当前知识库中的一些噪音数据,比如DBpedia中存在一些实体的birthplace是自己。

Keynote2: Knowledge Representation and the Semantic Web – an Ontologician´s View, by Sebastian Rudolph (TU Dresden, Germany)

该报告主要包括两部分内容:使用一些例子来讲述逻辑对于语义网的作用;讲述基于逻辑的知识表示的变化以及面对的主要问题。

上图展示了逻辑在问答中的作用。如果我们要查询知识库中所有的人,那么逻辑推理能够给我们很大帮助,例如利用subClassOf/subPropertyOf推理、domain/range推理等等。

基于逻辑的知识表示当前面对的问题主要包括两点:(1)数据中的噪音,可能引入矛盾的知识。由于推理规则 A 和 非A 能够推出任意 B,因此小的错误可能会对逻辑知识系统带来很大的灾难。目前常见的做法是采用fuzzy logic或者probabilistic logics(Markov logic)等等。(2)数据的动态性,目前知识是持久存储的,而网络上信息的更新速度远大于知识的更新速度。因此需要研究实时(real-time)的知识表示方法,但目前的自动索引和推理技术不能满足需求。

下图展示了讲者在总结部分对逻辑学家和其他语义网工作者的一些提示。

Keynote3: How to Make, Grow and Sell a Semantic Web Start-up, by Milan Stankovic (Sépage, Paris, France)

该讲者主要讲述了其使用语义网技术的旅游应用的创业经历(如下图所示),刚开始13年他在一次会议上作报告时获得了投资,后艰难发展迎来第一个客户,…,最终17年初创公司成功被大企业收购

该讲者还结合他自己的经历提出了一些至理名言,例如:

Success is getting what you want and failing at everything else.

If you are too busy, there must be something that you are doing wrong.

There is only one viable start-up ideology: common sense.

My paper

在这次大会上我报告了关于地理高考选择题求解方法的文章Answering Multiple-choice Questions in Geographical Gaokao with a Concept Graph.该工作包括从教材教辅表格构建地理概念图谱(刻画概念之间的关系和每个概念的相关文本描述),并采用搜索特定类型的路径的方式回答地理选择题。由于我的报告被安排在了地理相关资源的会场上,因此听众较少。听众主要关心的内容是,地理知识图谱构建方法如何推广到其他学科/领域。同时,有听者询问我们的问答方法是否受限于概念图谱的质量和规模,对于概念图谱目前无法回答的问题是否有尝试一些其他方法。

Related papers

Marco Avvenuti, Stefano Cresci, Leonardo Nizzoli and Maurizio Tesconi. Geoparsing and Geotagging with Machine Learning on top of Linked Data. (best paper candidate)

文章提出了一种使用多个知识源来发现、链接推特中的地理实体的方法。与传统方法不同的是,该方法同时考虑在多个知识库上进行地理实体的发现和链接,之后通过投票的机制来确定正确的实体。对于投票方法可能出现的问题(多数链接是错误的情况),该方法增加了一个使用监督学习的过滤方法,使用文本、链接、来源三个方面的特征,来确定每个链接的置信度。实验上,该方法在英文推特上结果几乎翻倍(30%+提升到60%+),在印第安语上从60%+提升至80%+。

Tu Nguyen and Wolfgang Nejdl. Multiple Models for Recommending Temporal Aspects of Entities.

该文章主要场景是,当用户搜索一个实体时(事件),是根据当前时间来推荐实体的不同方面。例如,在总统大选出结果之前,人们搜索大选更关注竞选人信息、竞选的预测;而当竞选结束后,用户再搜索大选一般需要的是大选的结果(虽然竞选预测等信息依然存在在网上)。文章的主要方法是对于搜索的目标实体分类,学习其周期性特征、趋势性特征、自相关特征、互相关特征,从而对于一个新的实体和搜索发生的时间做出预测。

Hamid Zafar, Giulio Napolitano and Jens Lehmann. Formal Query Generation for Question Answering over Knowledge Bases.

文章提出了一种KBQA方法。首先他假设问句中的实体、属性和答案在知识库上能够构成一个通路,任意两个实体之间的距离不超过两步。在找出所有候选通路之后,该方法将每条候选通路和问句的依存树通过一个预训练的Tree-LSTM转为向量,然后计算相似度,相似度高的选为生成的结构化查询。

Challenges, Tutorials, Awards

ESWC上举行了 Scalable Question Answering Challenge, 得奖队伍是 Dennis Diefenbach, Kamal Singh and Pierre Maret 的系统 WDAqua-core1.

Tutorial 部分How to build a QA system overnight和我们较为相关,介绍了QA的基本知识,基于 Semantic Parsing 的问答方法,基于Deep Learning的问答方法,并且包括一些编程实战。相关PPT和代码参见https://github.com/AskNowQA/QA-Tutorial

Best PhD Symposium颁发给Lucia Sicilian: Question Answering over Knowledge Bases.

Best Research Paper颁发给Alieh Saeedi, Eric Peukert and Erhard Rahm: Using Link Features for Entity Clustering in Knowledge Graphs.

Best Resource Paper颁发给Wouter Beek, Joe Raad, Jan Wielemaker and Frank van Harmelen. sameAs.cc: The Closure of 500M owl:sameAs Statements.

Best Inuse Paper颁发给Oktie Hassanzadeh, Shari Trewin and Alfio Massimiliano Gliozzo. Semantic Concept Discovery Over Event Databases.

ESWC19将在Portoroz举行。

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

 

自由讨论 | 关于高考机器人的讨论

近日,学霸君的高考机器人 Aidam 首次与 6 名高考理科状元在北京同台 PK,解答 2017 年高考文科数学试题。最终,Aidam 的成绩为 134 分,6 名状元的平均分为 135 分。语义网、知识图谱等领域的专家学者对学霸君在考试机器人上取得的突破进展十分关注,也因此展开了关于高考机器人的探讨。

继续阅读“自由讨论 | 关于高考机器人的讨论”

白硕 | 数字化不归路

本文转自阡寻科技公众号。
白硕 – 阡寻科技董事长。曾任中科院计算所研究员、博士导师、软件室主任、软件方向首席科学家。2000年起参与组建国家计算机网络应急技术协调中心(CNCERT/CC),2002年起任上海证券交易所总工程师。新一代交易系统设计师,自然语言及人工智能领域资深专家,中文信息学会理事。

 

一、穿透的魔力

今年六月一日,被邀请参加了一个脑洞大开的儿童节活动。通过酒店业一个数字化连锁扩张的活生生案例,激发了与会者关于数字化连锁经营的热烈讨论。

说起数字化,很多人联想到信息化。企业信息化的进程怎么说也有好几十年了吧,数字化不是信息化的前提条件么?没有数字化哪来的信息化?走到今天,怎么会突然提出数字化的问题?可能有些人想不通。

继续阅读“白硕 | 数字化不归路”

哈工大赛尔 | 事理图谱:事件演化的规律和模式

本文转载自公众号哈工大SCIR,作者为李忠阳,赵森栋,丁效。


引言

事件是人类社会的核心概念之一,人们的社会活动往往是事件驱动的。事件之间在时间上相继发生的演化规律和模式是一种十分有价值的知识。然而,当前无论是知识图谱还是语义网络等知识库的研究对象都不是事件。为了揭示事件的演化规律和发展逻辑,本文提出了事理图谱的概念,作为对人类行为活动的直接刻画。在图结构上,与马尔科夫逻辑网络(无向图)、贝叶斯网络(有向无环图)不同,事理图谱是一个有向有环图。现实世界中事件演化规律的复杂性决定了我们必须采用这种复杂的图结构。为了展示和验证事理图谱的研究价值和应用价值,我们从互联网非结构化数据中抽取、构建了一个出行领域事理图谱。初步结果表明,事理图谱可以为揭示和发现事件演化规律与人们的行为模式提供强有力的支持。

继续阅读“哈工大赛尔 | 事理图谱:事件演化的规律和模式”