领域应用 | 阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核

本文转自公众号阿里技术


阿里妹导读:借助阿里知识图谱的建设,阿里电商平台管控从过去的“巡检”模式升级为发布端实时逐一检查。在海量的商品发布量的挑战下,最大可能地借助大数据、人工智能阻止坏人、问题商品进入阿里生态。同时面临问题商家实时的对弈、变异和恶意攻击等诸多挑战,知识图谱仍然保持着每天千万级别的拦截量,亿级别的全量智能审核次数,在滥发、侵权、合规、假货、经营范围等多个场景全面与问题卖家正面交锋,实时对弈。为了最大限度地保护知识产权,保护消费者权益,我们对知识图谱推理引擎技术提出了智能化、自学习、毫秒级响应、可解释等更高地技术要求,实现良好的社会效益。

继续阅读“领域应用 | 阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核”

领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?

本文转载自公众号恒生技术之眼,作者为应雄,姜海军,楼承先。


近年来,由于金融科技(FinTech) 的迅猛发展,传统金融领域与金融科技的结合也越来越密切,金融科技产品如雨后春笋般涌现,人们对这些金融产品的关注和参与度也迅速高涨。然而现有的金融科技产品琳琅满目,与这些产品相关的资讯更是众多纷纭,人们要从这海量的资讯中获取自己关注和感兴趣的资讯变得极其繁琐和困难。推荐系统作为解决信息过载问题的有效手段之一,已被广泛应用于各个领域,该系统能够主动的向用户提供需求信息,让每个用户都能够得到具有针对性的推荐结果。然而现有的许多推荐算法存在没有考虑物品本身内涵知识的缺陷,导致对资讯内容分析的不完全和不精确,使得推荐效果不理想。本文的主要贡献在于提出了一个知识图谱和推荐系统的融合模型,在基于经典推荐算法基础上,充分考虑资讯本身内在的语义信息,利用资讯之间的标签关联关系,有效地提升了推荐算法的准确率、召回率和F值。

继续阅读“领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?”

领域应用 | 实事求是谈金融报告自动化

本文转载文因互联公众号,根据作者在某咨询公司的讲座整理。


三个迷信

在讲具体的技术之前,我想先说说关于人工智能的三个迷信。

第一个迷信,因为AlphaGo 战胜了围棋冠军,所以 AI 也可以做 XYZ(比如炒股)。可事实是,AlphaGo 只是 AI 的极小的一个分支。AI 总体还是处于“有多少人工就有多少智能”的水平。

第二个迷信,因为机器效率高,所以效率低的人会被机器消灭掉。我一开始也是这样想的,但是后来我发现并不是这样的。比如说计算器,计算器做加减乘除是比所有的人做得效率都高的。但会计并没有因为计算器而失业。恰恰相反,现在这个时刻,可能是人类历史上会计最多的一个时刻,未来还有可能更多。能被机器取代的,是完全的机械工作,就像工厂里的机器人那种工作,月工资2000块钱以下的那种工作。大多数的工作还是需要创造力的,至少需要有一部分的创造力。当机器提高了工作效率之后,实际上是使得拥有这种技能的人反而被增强了,而不是被替代了。所以在我看来,分析师肯定不会被机器替代掉,而是随着机器能力的上升,分析师的人数将来会越来越多。
继续阅读“领域应用 | 实事求是谈金融报告自动化”

闫峻 | 知识就是力量,让机器站在巨人的肩膀上

本文转载自公众号微软研究院AI头条,作者为微软亚洲研究院资深研究员闫峻博士。


编者按:人类社会的进步,尤其是科技的进步,大多是站在前人的肩膀上一步一步发展起来的。在人工智能领域,当前很多统计机器学习算法都是从零开始学习数据,而可计算知识的引入则能够让机器读取已知的知识,并以此为基础进行新的学习,在巨人的肩膀上迅速实现进步。

知识对于认知计算的重要性不言而喻,当前聚焦于知识领域的研究和探索也非常丰富。本文中,微软亚洲研究院资深研究员闫峻博士将结合实际案例为大家详解知识领域的“四大问题”,回答你心中有关可计算知识的小疑惑。

 

继续阅读“闫峻 | 知识就是力量,让机器站在巨人的肩膀上”

漆桂林 | 知识图谱之语义网络篇

本文转发自漆桂林老师的知乎专栏:知识图谱和智能问答。


开篇还是从我在情报工程发表的一篇论文的前言开始讲起。

知识图谱(Knowledge Graph)的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎,并且于 2013 年以后开始在学术界和业界普及,并在智能问答、情报分析、反欺诈等应用中发挥重要作用。知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,比如说两个实体之间的相似关系。语义网络[1]是 20 世纪 50 年代末 60 年代初提出,代表性人物有 M. Ross Quillian 和 Robert F. Simmons。语义网络可以看成是一种用于存储知识的数据结构,即基于图的数据结构,这里的图可以是有向图,也可以是无向图。使用语义网络,可以很方便地将自然语言的句子用图来表达和存储,用于机器翻译[2]、问答系统[3]和自然语言理解[4]。下面就举一个例子,比如说,要表示 John gave a book to Mary 这样一句话,可以用下面这样的一个语义网络来表示:

继续阅读“漆桂林 | 知识图谱之语义网络篇”

论文动态 | 基于知识图谱的问答系统关键技术研究 #03

 本文转载自 PaperWeekly 公众号,作者为崔万云复旦大学知识工场实验室博士生,研究方向为问答系统和知识图谱。


第 5 节 复杂问题回答

这一节详细阐述如何回答复杂问题。首先第 5.1. 节将问题形式化为一个最优化问题。第 5.2. 节和第 5.3. 节分别阐述优化量度和算法。

5.1. 问题陈述

本节着重关注由一系列 BFQ 组成的复杂问题,例如表 1.1 中的问题 ○f 可以被分解为两个 BFQ:(1) BarackObama’swife (MichelleObama);(2) WhenwasMichelleObama born? (1964 年)。显然,第二个问题的答案依赖于第一个问题的答案。在解答复杂问题时,分而治之框架可以自然而然地被利用:(1) 系统首先把问题分解为一系列 BFQ,(2) 然后系统依次回答每个问题。既然在第 3 节已经给出了如何回答 BFQ,那么这一节中的关键步骤就是问题分解。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #03”

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

本文转载自 PaperWeekly 公众号,作者为崔万云复旦大学知识工场实验室博士生,研究方向为问答系统和知识图谱。


第五章 从问答语料库和知识图谱学习问答

问答系统(QA)已经成为人类访问十亿级知识图谱的流行方式。与网络搜索不同,在自然语言问题能够被精确地理解和映射到知识图谱上的结构化查询的前提下,基于知识图谱的问答系统将给出准确且简洁的结果。这其中的挑战是人类可以以许多不同的方式提出同一询问。现有的解决方案由于它们的模型表示而有着天然的缺陷:基于规则的实现只能理解一小部分的问题,而基于关键词或同义词的实现不能完整地理解问题。在十亿规模的知识图谱和百万规模的问答语料库的基础上,本章设计了一种新的问题表现形式:问题模板。例如,对于一个关于某个城市人口数目的问题,可以学习到诸如 what is the total number of people in $city? 或 how many people are there in $city? 这样的问题模板。本章共为 2782 种关系学习了约两千七百万种模板。基于这些模板,本章设计的问答系统 KBQA 能够有效地支持二元事实型问题,以及由一系列二元事实型问题组合而成的复杂问题。此外,通过将 RDF 知识图谱进行属性扩展,知识图谱的覆盖范围提高了 57 倍。在 QALD 标准测试集上,KBQA 系统在有效性和效率上击败了其他所有竞争对手。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #02”

论文动态 | 基于知识图谱的问答系统关键技术研究 #01

本文转载自公众号 PaperWeekly,作者为复旦大学知识工场实验室博士生崔万云,研究方向为问答系统和知识图谱。


 

第一章 绪论


第 1 节 问答系统背景介绍

2011 年 10 月 14 日,苹果公司在其 iPhone 4S 发布会上隆重推出新一代智能个人助理 Siri。Siri 通过自然语言的交互形式实现问答、结果推荐、手机操作等功能,并集成进 iOS 5 及之后版本。2012 年 7 月 9 日,谷歌发布智能个人助理 Google Now,通过自然语言交互的方式提供页面搜索、自动指令等功能。2014 年 4 月 2 日,微软发布同类产品 Cortana,2014 年 10 月,亚马逊发布同类产品 Alexa。在此之前的 2011 年 9 月,由 IBM 研发的 Watson 机器人参加智力问答节目“Jeopardy!”,并战胜该节目的前冠军 Brad Rut- ter 和 Ken Jennings,豪取一百万美金大奖。

继续阅读“论文动态 | 基于知识图谱的问答系统关键技术研究 #01”