领域应用 | 实事求是谈金融报告自动化

本文转载文因互联公众号,根据作者在某咨询公司的讲座整理。


三个迷信

在讲具体的技术之前,我想先说说关于人工智能的三个迷信。

第一个迷信,因为AlphaGo 战胜了围棋冠军,所以 AI 也可以做 XYZ(比如炒股)。可事实是,AlphaGo 只是 AI 的极小的一个分支。AI 总体还是处于“有多少人工就有多少智能”的水平。

第二个迷信,因为机器效率高,所以效率低的人会被机器消灭掉。我一开始也是这样想的,但是后来我发现并不是这样的。比如说计算器,计算器做加减乘除是比所有的人做得效率都高的。但会计并没有因为计算器而失业。恰恰相反,现在这个时刻,可能是人类历史上会计最多的一个时刻,未来还有可能更多。能被机器取代的,是完全的机械工作,就像工厂里的机器人那种工作,月工资2000块钱以下的那种工作。大多数的工作还是需要创造力的,至少需要有一部分的创造力。当机器提高了工作效率之后,实际上是使得拥有这种技能的人反而被增强了,而不是被替代了。所以在我看来,分析师肯定不会被机器替代掉,而是随着机器能力的上升,分析师的人数将来会越来越多。
继续阅读“领域应用 | 实事求是谈金融报告自动化”

漆桂林 | 知识图谱之语义网络篇

本文转发自漆桂林老师的知乎专栏:知识图谱和智能问答。


开篇还是从我在情报工程发表的一篇论文的前言开始讲起。

知识图谱(Knowledge Graph)的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎,并且于 2013 年以后开始在学术界和业界普及,并在智能问答、情报分析、反欺诈等应用中发挥重要作用。知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,比如说两个实体之间的相似关系。语义网络[1]是 20 世纪 50 年代末 60 年代初提出,代表性人物有 M. Ross Quillian 和 Robert F. Simmons。语义网络可以看成是一种用于存储知识的数据结构,即基于图的数据结构,这里的图可以是有向图,也可以是无向图。使用语义网络,可以很方便地将自然语言的句子用图来表达和存储,用于机器翻译[2]、问答系统[3]和自然语言理解[4]。下面就举一个例子,比如说,要表示 John gave a book to Mary 这样一句话,可以用下面这样的一个语义网络来表示:

继续阅读“漆桂林 | 知识图谱之语义网络篇”

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

本文转载自 PaperWeekly 公众号,作者为崔万云复旦大学知识工场实验室博士生,研究方向为问答系统和知识图谱。


第五章 从问答语料库和知识图谱学习问答

问答系统(QA)已经成为人类访问十亿级知识图谱的流行方式。与网络搜索不同,在自然语言问题能够被精确地理解和映射到知识图谱上的结构化查询的前提下,基于知识图谱的问答系统将给出准确且简洁的结果。这其中的挑战是人类可以以许多不同的方式提出同一询问。现有的解决方案由于它们的模型表示而有着天然的缺陷:基于规则的实现只能理解一小部分的问题,而基于关键词或同义词的实现不能完整地理解问题。在十亿规模的知识图谱和百万规模的问答语料库的基础上,本章设计了一种新的问题表现形式:问题模板。例如,对于一个关于某个城市人口数目的问题,可以学习到诸如 what is the total number of people in $city? 或 how many people are there in $city? 这样的问题模板。本章共为 2782 种关系学习了约两千七百万种模板。基于这些模板,本章设计的问答系统 KBQA 能够有效地支持二元事实型问题,以及由一系列二元事实型问题组合而成的复杂问题。此外,通过将 RDF 知识图谱进行属性扩展,知识图谱的覆盖范围提高了 57 倍。在 QALD 标准测试集上,KBQA 系统在有效性和效率上击败了其他所有竞争对手。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #02”

论文动态 | 基于知识图谱的问答系统关键技术研究 #01

本文转载自公众号 PaperWeekly,作者为复旦大学知识工场实验室博士生崔万云,研究方向为问答系统和知识图谱。


 

第一章 绪论


第 1 节 问答系统背景介绍

2011 年 10 月 14 日,苹果公司在其 iPhone 4S 发布会上隆重推出新一代智能个人助理 Siri。Siri 通过自然语言的交互形式实现问答、结果推荐、手机操作等功能,并集成进 iOS 5 及之后版本。2012 年 7 月 9 日,谷歌发布智能个人助理 Google Now,通过自然语言交互的方式提供页面搜索、自动指令等功能。2014 年 4 月 2 日,微软发布同类产品 Cortana,2014 年 10 月,亚马逊发布同类产品 Alexa。在此之前的 2011 年 9 月,由 IBM 研发的 Watson 机器人参加智力问答节目“Jeopardy!”,并战胜该节目的前冠军 Brad Rut- ter 和 Ken Jennings,豪取一百万美金大奖。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #01”

鲍捷 | 知识图谱在金融领域的发展与应用

本文来自文因互联CEO鲍捷博士,2017年7月11日参加上海市——『信息化专家委沙龙——人工智能与知识管理』主题活动所做演讲。

活动介绍:

上海市信息化专家委员会成立于1999年,是为促进实施上海信息化发展战略而成立的高级专家组织,主要通过开展各类研究和咨询,为提高上海信息化发展质量和水平、提升上海城市综合竞争力提供智力支持。为积极拓展新型智库发展途径,信息化专家委与上海研究院加强深度合作,共同举办信息化专家委系列沙龙活动,集聚专家智慧,共商趋势热点。本期信息化专家委沙龙,将聚焦人工智能与知识管理领域,邀请企业、研究机构、政府部门的专家头脑风暴,开展讨论。

继续阅读“鲍捷 | 知识图谱在金融领域的发展与应用”

漆桂林 | 开放:知识图谱发展的必由之路

​本文整理自漆桂林老师在广州知识图谱与问答系统论坛上的演讲。

首先向大家介绍一下我们研讨会的一些情况。本次研讨会是知识图谱系列活动之一,我们几乎每个月都会举行知识图谱相关的活动。这次活动是知识图谱论坛,它是在中文信息协会下属的语言与知识计算专业委员会组织的活动。这个组织是我们中国的知识图谱的一个官方组织,这个组织的主任是李涓子教授。由于李涓子教授事务繁忙,所以由我跟刘康老师来主持这个论坛,我们作为系列论坛的组织方,那么这一次非常高兴能够到广州来,把这个论坛放到广州来,而且本次论坛的主题也非常有吸引力,知识图谱与问答系统论坛。我可能不会给大家介绍知识图谱,因为王昊奋老师会做更深入的介绍。我给大家介绍的我们正在做的一个事情,这个是我们知识图谱领域下面要发生的一个大事,希望大家能够仔细关注,也希望大家能够来做一些贡献。

继续阅读“漆桂林 | 开放:知识图谱发展的必由之路”

肖仰华 | 当知识图谱“遇见”深度学习

本文转载自中国人工智能学会通讯 2017 第 4 期,排版转自公众号 PaperWeekly。

大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的“喂养”下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽,深度学习模型效果的天花板日益迫近。另一方面大量知识图谱不断涌现,这些蕴含人类大量先验知识的宝库却尚未被深度学习有效利用。融合知识图谱与深度学习,已然成为进一步提升深度学习模型效果的重要思路之一。以知识图谱为代表的符号主义、以深度学习为代表的联结主义,日益脱离原先各自独立发展的轨道,走上协同并进的新道路。

继续阅读“肖仰华 | 当知识图谱“遇见”深度学习”

漆桂林等 | 知识图谱研究进展

本文节选自《情报工程》2017 年第 1 期,知识图谱专题稿件,转发自公众号 PaperWeekly

本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义。其次,介绍知识图谱构建的关键技术,包括实体关系识别技术、知识融合技术、实体链接技术和知识推理技术等。然后,给出现有开放的知识图谱数据集的介绍。最后,给出知识图谱在情报分析中的应用案例。

继续阅读“漆桂林等 | 知识图谱研究进展”

邹磊 | 浅谈知识图谱数据管理

本文转自北京大数据研究院 BIBDR 公众号。
近年来随着“人工智能”概念的再度活跃,除了“深度学习”这个炙手可热的名词以外,“知识图谱”无疑也是研究者、工业界和投资人心目中的又一颗“银弹”。简单地说,“知识图谱”就是以图形(Graph)的方式来展现“实体”、实体“属性”,以及实体之间的“关系”。 继续阅读“邹磊 | 浅谈知识图谱数据管理”