论文动态 | 基于知识图谱的问答系统关键技术研究 #04

本文转载自公众号 PaperWeekly。

作者丨崔万云

学校丨复旦大学博士

研究方向丨问答系统,知识图谱

领域问答的基础在于领域知识图谱。对于特定领域,其高质量、结构化的知识往往是不存在,或者是极少的。本章希望从一般文本描述中抽取富含知识的句子,并将其结构化,作为问答系统的知识源。特别的,对于不同的领域,其“知识”的含义是不一样的。有些数据对于某一领域是关键知识,而对于另一领域则可能毫无意义。传统的知识提取方法没有考虑具体领域特征。
继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #04”

白硕 | 数字化不归路

本文转自阡寻科技公众号。
白硕 – 阡寻科技董事长。曾任中科院计算所研究员、博士导师、软件室主任、软件方向首席科学家。2000年起参与组建国家计算机网络应急技术协调中心(CNCERT/CC),2002年起任上海证券交易所总工程师。新一代交易系统设计师,自然语言及人工智能领域资深专家,中文信息学会理事。

 

一、穿透的魔力

今年六月一日,被邀请参加了一个脑洞大开的儿童节活动。通过酒店业一个数字化连锁扩张的活生生案例,激发了与会者关于数字化连锁经营的热烈讨论。

说起数字化,很多人联想到信息化。企业信息化的进程怎么说也有好几十年了吧,数字化不是信息化的前提条件么?没有数字化哪来的信息化?走到今天,怎么会突然提出数字化的问题?可能有些人想不通。

继续阅读“白硕 | 数字化不归路”

哈工大赛尔 | 事理图谱:事件演化的规律和模式

本文转载自公众号哈工大SCIR,作者为李忠阳,赵森栋,丁效。


引言

事件是人类社会的核心概念之一,人们的社会活动往往是事件驱动的。事件之间在时间上相继发生的演化规律和模式是一种十分有价值的知识。然而,当前无论是知识图谱还是语义网络等知识库的研究对象都不是事件。为了揭示事件的演化规律和发展逻辑,本文提出了事理图谱的概念,作为对人类行为活动的直接刻画。在图结构上,与马尔科夫逻辑网络(无向图)、贝叶斯网络(有向无环图)不同,事理图谱是一个有向有环图。现实世界中事件演化规律的复杂性决定了我们必须采用这种复杂的图结构。为了展示和验证事理图谱的研究价值和应用价值,我们从互联网非结构化数据中抽取、构建了一个出行领域事理图谱。初步结果表明,事理图谱可以为揭示和发现事件演化规律与人们的行为模式提供强有力的支持。

继续阅读“哈工大赛尔 | 事理图谱:事件演化的规律和模式”

袁峻峰 | AI 与理性投资——基于金融知识图谱的智能问答

本文转自公众号蚂蚁金服评论,版权属于袁峻峰,仅代表个人观点。
作者介绍:袁峻峰,花名观妙,蚂蚁金服人工智能部。

 

国内的股票市场,一般认为是更加倾向于主题投资而不是基本面、价值投资的市场,原因之一是散户贡献了大部分成交量。与此同时,监管机构一再教育广大投资者要理性投资、价值投资,在2017年全国证券期货监管工作会议上,证监会主席刘士余也批判了题材炒作,鼓励理性投资、价值投资。

理性一直是人类探讨的一个永恒话题。本文并不打算就这一话题展开讨论,这里只描述下相关假设。本文所描述理性是按诺贝尔经济学奖,图灵奖获得者郝伯特·西蒙的不确定性环境下决策理论中的定义:理性应当是有限的理性,而不是完全理性;应当是过程合理性,而不是本质合理性。过程理性决策步骤可以参考文章[1][3]中描述。其实不论价值投资还是主题投资其实都可以理性投资。

继续阅读“袁峻峰 | AI 与理性投资——基于金融知识图谱的智能问答”

漆桂林 | 开放:知识图谱发展的必由之路

​本文整理自漆桂林老师在广州知识图谱与问答系统论坛上的演讲。

首先向大家介绍一下我们研讨会的一些情况。本次研讨会是知识图谱系列活动之一,我们几乎每个月都会举行知识图谱相关的活动。这次活动是知识图谱论坛,它是在中文信息协会下属的语言与知识计算专业委员会组织的活动。这个组织是我们中国的知识图谱的一个官方组织,这个组织的主任是李涓子教授。由于李涓子教授事务繁忙,所以由我跟刘康老师来主持这个论坛,我们作为系列论坛的组织方,那么这一次非常高兴能够到广州来,把这个论坛放到广州来,而且本次论坛的主题也非常有吸引力,知识图谱与问答系统论坛。我可能不会给大家介绍知识图谱,因为王昊奋老师会做更深入的介绍。我给大家介绍的我们正在做的一个事情,这个是我们知识图谱领域下面要发生的一个大事,希望大家能够仔细关注,也希望大家能够来做一些贡献。

继续阅读“漆桂林 | 开放:知识图谱发展的必由之路”

数据动态 | “方药”模块发布——中医药知识服务平台升级

本文转自中医药知识服务平台公众号,作者为田野,于彤。

中医药知识服务平台 (http://www.tcmkb.cn) 集成了中医药领域的领域本体、术语资源(包括中医药学语言系统、中医临床术语集、中医古籍语言系统等),以及证候、中药、方剂等领域的知识库,面向中医专家提供知识检索、知识问答、知识浏览等服务。

系统研发团队近期对平台进行更新升级,增加了方药模块,该模块下设置包括中药、中成药、药典(中药)、医院院内制剂、西药等分类模块,全面整合方药类相关数据,以期为中医专家们更好的提供检索服务。

继续阅读“数据动态 | “方药”模块发布——中医药知识服务平台升级”

鲍捷 | Web:为所有人-——记图灵奖得主 Tim Berners-Lee 的伟大贡献

​来源:文因互联 CEO 鲍捷博士发布于《中国计算机学会通讯》2017年第6期《动态》
编者按
蒂姆·伯纳斯-李(Tim Berners-Lee),人们通常称他为Tim。作为万维网(World Wide Web,Web)的发明人而为世人所知,他也因此获得了2016年的图灵奖。但他的贡献并不止于Web。在过去近三十年的工作里,他的贡献大体可分为三个阶段。第一阶段从1989年到1999年,他的主要精力在Web本身的发明和推广上,贡献是互联的文档。第二阶段是1999年到2009年,他主要在推广语义网,贡献是互联的知识。第三个阶段从2009年至今,主要致力于数据的开放、安全和隐私,贡献是互联的社会。本文简述他在这三个阶段的贡献。

继续阅读“鲍捷 | Web:为所有人-——记图灵奖得主 Tim Berners-Lee 的伟大贡献”

海翼知 | 图谱在手 天下我有

本文转载自公众号 PlantData知识图谱实战,内容整理自胡芳槐博士 6 月 9 日北理工知识图谱实战学习活动上分享的《知识图谱应用关键技术及行业应用》的PPT报告。

胡芳槐博士,上海海翼知信息科技有限公司创始人,现任上海海翼知信息科技有限公司 CTO,知识图谱和本体学习 6 年以上的研究以及产业化经验,多个相关方向的国家项目和上海市政府项目骨干成员,国内最早研究中文知识图谱构建并进行产业化探索实践,在国际知名会议和期刊上发表多篇中文图谱构建、机器学习方面相关论文。

继续阅读“海翼知 | 图谱在手 天下我有”

阮彤 | 中文医疗健康知识图谱在临床电子病历挖掘中的应用探讨

​作者介绍

阮彤 – 现任华东理工大学计算机技术研究所所长,自然语言处理与大数据挖掘实验室主任,专注于自然语言处理、知识图谱方面的研究,承担了多项 863 与科技支撑项目。

以医院电子病历为核心的临床数据记录了病人的疾病、诊断和治疗信息。挖掘此类数据,可以辅助医生了解人口学信息、临床症状、治疗方法和疗效之间的量化关系,帮助病人选择更好的治疗方案,进而提升医疗服务质量,降低医疗成本。

然而,在临床中,大量的医疗文书是以文本形式存在。同时,医生录入缺乏语义规范,同一诊断与治疗方案,不同医生的录入结果会不同。因此,在挖掘之前,需要对数据进行结构化与规范化。在这个过程中,医疗健康知识图谱是不可或缺的一部分。另外,病历数据处理和使用过程中,通过病历数据与健康图谱的关联挖掘,可以获得更为隐含的、深刻的信息。为处理方便,整体用知识图谱表示与关联,会更为方便有效。

继续阅读“阮彤 | 中文医疗健康知识图谱在临床电子病历挖掘中的应用探讨”

技术动态 | 揭开知识库问答 KB-QA 的面纱 9 · 非结构化知识源篇

​作者,四川大学博士生,刘大一恒。本文已经获得 ChatbotMagazine 公众号授权。
内容速览
☛ 非结构化的知识库——维基百科☛ 思路与模型(文档检索与文档理解;段落encoding、问题encoding与答案预测)☛ 实验与总结

如果你想寻找一个问题的答案,比如谢霆锋的出生年月,那么你可能会先去查看关于谢霆锋的百度百科 或者 维基百科,找到和出生年月相关的那一行信息,再提取答案。那么,我们能不能让机器也这样去回答问题呢?在我们前面讲到的文章中,我们都使用了结构化的知识库来回答问题,今天我们将介绍一种使用非结构化的知识库——维基百科作为知识源来进行KB-QA。

继续阅读“技术动态 | 揭开知识库问答 KB-QA 的面纱 9 · 非结构化知识源篇”