领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?

本文转载自公众号恒生技术之眼,作者为应雄,姜海军,楼承先。


近年来,由于金融科技(FinTech) 的迅猛发展,传统金融领域与金融科技的结合也越来越密切,金融科技产品如雨后春笋般涌现,人们对这些金融产品的关注和参与度也迅速高涨。然而现有的金融科技产品琳琅满目,与这些产品相关的资讯更是众多纷纭,人们要从这海量的资讯中获取自己关注和感兴趣的资讯变得极其繁琐和困难。推荐系统作为解决信息过载问题的有效手段之一,已被广泛应用于各个领域,该系统能够主动的向用户提供需求信息,让每个用户都能够得到具有针对性的推荐结果。然而现有的许多推荐算法存在没有考虑物品本身内涵知识的缺陷,导致对资讯内容分析的不完全和不精确,使得推荐效果不理想。本文的主要贡献在于提出了一个知识图谱和推荐系统的融合模型,在基于经典推荐算法基础上,充分考虑资讯本身内在的语义信息,利用资讯之间的标签关联关系,有效地提升了推荐算法的准确率、召回率和F值。

继续阅读“领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?”

领域应用 | 实事求是谈金融报告自动化

本文转载文因互联公众号,根据作者在某咨询公司的讲座整理。


三个迷信

在讲具体的技术之前,我想先说说关于人工智能的三个迷信。

第一个迷信,因为AlphaGo 战胜了围棋冠军,所以 AI 也可以做 XYZ(比如炒股)。可事实是,AlphaGo 只是 AI 的极小的一个分支。AI 总体还是处于“有多少人工就有多少智能”的水平。

第二个迷信,因为机器效率高,所以效率低的人会被机器消灭掉。我一开始也是这样想的,但是后来我发现并不是这样的。比如说计算器,计算器做加减乘除是比所有的人做得效率都高的。但会计并没有因为计算器而失业。恰恰相反,现在这个时刻,可能是人类历史上会计最多的一个时刻,未来还有可能更多。能被机器取代的,是完全的机械工作,就像工厂里的机器人那种工作,月工资2000块钱以下的那种工作。大多数的工作还是需要创造力的,至少需要有一部分的创造力。当机器提高了工作效率之后,实际上是使得拥有这种技能的人反而被增强了,而不是被替代了。所以在我看来,分析师肯定不会被机器替代掉,而是随着机器能力的上升,分析师的人数将来会越来越多。
继续阅读“领域应用 | 实事求是谈金融报告自动化”

闫峻 | 知识就是力量,让机器站在巨人的肩膀上

本文转载自公众号微软研究院AI头条,作者为微软亚洲研究院资深研究员闫峻博士。


编者按:人类社会的进步,尤其是科技的进步,大多是站在前人的肩膀上一步一步发展起来的。在人工智能领域,当前很多统计机器学习算法都是从零开始学习数据,而可计算知识的引入则能够让机器读取已知的知识,并以此为基础进行新的学习,在巨人的肩膀上迅速实现进步。

知识对于认知计算的重要性不言而喻,当前聚焦于知识领域的研究和探索也非常丰富。本文中,微软亚洲研究院资深研究员闫峻博士将结合实际案例为大家详解知识领域的“四大问题”,回答你心中有关可计算知识的小疑惑。

 

继续阅读“闫峻 | 知识就是力量,让机器站在巨人的肩膀上”

漆桂林 | 知识图谱之语义网络篇

本文转发自漆桂林老师的知乎专栏:知识图谱和智能问答。


开篇还是从我在情报工程发表的一篇论文的前言开始讲起。

知识图谱(Knowledge Graph)的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎,并且于 2013 年以后开始在学术界和业界普及,并在智能问答、情报分析、反欺诈等应用中发挥重要作用。知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,比如说两个实体之间的相似关系。语义网络[1]是 20 世纪 50 年代末 60 年代初提出,代表性人物有 M. Ross Quillian 和 Robert F. Simmons。语义网络可以看成是一种用于存储知识的数据结构,即基于图的数据结构,这里的图可以是有向图,也可以是无向图。使用语义网络,可以很方便地将自然语言的句子用图来表达和存储,用于机器翻译[2]、问答系统[3]和自然语言理解[4]。下面就举一个例子,比如说,要表示 John gave a book to Mary 这样一句话,可以用下面这样的一个语义网络来表示:

继续阅读“漆桂林 | 知识图谱之语义网络篇”

论文动态 | 基于知识图谱的问答系统关键技术研究 #03

 本文转载自 PaperWeekly 公众号,作者为崔万云复旦大学知识工场实验室博士生,研究方向为问答系统和知识图谱。


第 5 节 复杂问题回答

这一节详细阐述如何回答复杂问题。首先第 5.1. 节将问题形式化为一个最优化问题。第 5.2. 节和第 5.3. 节分别阐述优化量度和算法。

5.1. 问题陈述

本节着重关注由一系列 BFQ 组成的复杂问题,例如表 1.1 中的问题 ○f 可以被分解为两个 BFQ:(1) BarackObama’swife (MichelleObama);(2) WhenwasMichelleObama born? (1964 年)。显然,第二个问题的答案依赖于第一个问题的答案。在解答复杂问题时,分而治之框架可以自然而然地被利用:(1) 系统首先把问题分解为一系列 BFQ,(2) 然后系统依次回答每个问题。既然在第 3 节已经给出了如何回答 BFQ,那么这一节中的关键步骤就是问题分解。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #03”

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

本文转载自 PaperWeekly 公众号,作者为崔万云复旦大学知识工场实验室博士生,研究方向为问答系统和知识图谱。


第五章 从问答语料库和知识图谱学习问答

问答系统(QA)已经成为人类访问十亿级知识图谱的流行方式。与网络搜索不同,在自然语言问题能够被精确地理解和映射到知识图谱上的结构化查询的前提下,基于知识图谱的问答系统将给出准确且简洁的结果。这其中的挑战是人类可以以许多不同的方式提出同一询问。现有的解决方案由于它们的模型表示而有着天然的缺陷:基于规则的实现只能理解一小部分的问题,而基于关键词或同义词的实现不能完整地理解问题。在十亿规模的知识图谱和百万规模的问答语料库的基础上,本章设计了一种新的问题表现形式:问题模板。例如,对于一个关于某个城市人口数目的问题,可以学习到诸如 what is the total number of people in $city? 或 how many people are there in $city? 这样的问题模板。本章共为 2782 种关系学习了约两千七百万种模板。基于这些模板,本章设计的问答系统 KBQA 能够有效地支持二元事实型问题,以及由一系列二元事实型问题组合而成的复杂问题。此外,通过将 RDF 知识图谱进行属性扩展,知识图谱的覆盖范围提高了 57 倍。在 QALD 标准测试集上,KBQA 系统在有效性和效率上击败了其他所有竞争对手。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #02”

论文动态 | 基于知识图谱的问答系统关键技术研究 #01

本文转载自公众号 PaperWeekly,作者为复旦大学知识工场实验室博士生崔万云,研究方向为问答系统和知识图谱。


 

第一章 绪论


第 1 节 问答系统背景介绍

2011 年 10 月 14 日,苹果公司在其 iPhone 4S 发布会上隆重推出新一代智能个人助理 Siri。Siri 通过自然语言的交互形式实现问答、结果推荐、手机操作等功能,并集成进 iOS 5 及之后版本。2012 年 7 月 9 日,谷歌发布智能个人助理 Google Now,通过自然语言交互的方式提供页面搜索、自动指令等功能。2014 年 4 月 2 日,微软发布同类产品 Cortana,2014 年 10 月,亚马逊发布同类产品 Alexa。在此之前的 2011 年 9 月,由 IBM 研发的 Watson 机器人参加智力问答节目“Jeopardy!”,并战胜该节目的前冠军 Brad Rut- ter 和 Ken Jennings,豪取一百万美金大奖。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #01”

技术动态 | 手把手带你入门微软 Graph Engine

本文转载自微软研究院 AI 头条公众号,作者为李亚韬。

导读:出自微软亚洲研究院的 Graph Engine(原名Trinity)是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户高效地处理大规模图数据,且更方便地构建实时查询应用和高吞吐量的离线分析平台。自 2015 年发布以来,Graph Engine 受到了来自学术界和工业界的广泛关注。访问 Graph Engine 的 GitHub 页面(https://github.com/Microsoft/GraphEngine)。

继续阅读“技术动态 | 手把手带你入门微软 Graph Engine”

鲍捷 | 知识图谱在金融领域的发展与应用

本文来自文因互联CEO鲍捷博士,2017年7月11日参加上海市——『信息化专家委沙龙——人工智能与知识管理』主题活动所做演讲。

活动介绍:

上海市信息化专家委员会成立于1999年,是为促进实施上海信息化发展战略而成立的高级专家组织,主要通过开展各类研究和咨询,为提高上海信息化发展质量和水平、提升上海城市综合竞争力提供智力支持。为积极拓展新型智库发展途径,信息化专家委与上海研究院加强深度合作,共同举办信息化专家委系列沙龙活动,集聚专家智慧,共商趋势热点。本期信息化专家委沙龙,将聚焦人工智能与知识管理领域,邀请企业、研究机构、政府部门的专家头脑风暴,开展讨论。

继续阅读“鲍捷 | 知识图谱在金融领域的发展与应用”

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

1. 工具特色

FudanDNN-NLP3.0 是由复旦大学计算机学院机器人研究实验室所开发的基于深度学习的中文自然语言处理工具,该工具目前可用于中文分词、命名识别、词性标注、句子分类、语义分析、知识库访问、对话问答。深度学习方法的优点在于不需要预先根据任务进行特征的选择(特征工程),系统所需参数较少(节省内存开销),并且实际使用速度优于其它相似性能的系统。该工具目前具备以下特点:

继续阅读“技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0”