领域应用 | 深度学习在知识图谱构建中的应用

2018-03-19 游维

本文转载自公众号:阿里技术

深度学习模型介绍

DeepDive系统在数据处理阶段很大程度上依赖于NLP工具,如果NLP的过程中存在错误,这些错误将会在后续的标注和学习步骤中被不断传播放大,影响最终的关系抽取效果。为了避免这种传播和影响,近年来深度学习技术开始越来越多地在关系抽取任务中得到重视和应用。本章主要介绍一种远程监督标注与基于卷积神经网络的模型相结合的关系抽取方法以及该方法的一些改进技术。

继续阅读“领域应用 | 深度学习在知识图谱构建中的应用”

领域应用 | 知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?

2018-03-15 游维

本文转载自公众号:阿里技术

阿里妹导读:搜索“西红柿”,你不但能知道它的营养功效、热量,还能顺带学会煲个牛腩、炒个鸡蛋!搜索引擎何时变成“暖男”了?原来背后有“知识图谱”这个强大的秘密武器。

作为近年来搜索领域和自然语言处理领域的热点,知识图谱正引领着搜索引擎向知识引擎的转变。在阿里的“神马搜索”中,知识图谱及其相关技术的广泛应用不仅能帮助用户找到最想要的信息,更能让用户有意想不到的知识收获。

继续阅读“领域应用 | 知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?”

刘志明 | 知识图谱及金融相关

本文转载自公众号:挖地兔,本文的作者刘志明先生也是 Tushare 的作者。

Tushare 是一个基于 Python 语言的免费、开源的财经数据接口包,可以为金融量化分析人员提供快速、整洁和多样的结构化数据,帮助量化投资人员节省数据采集和清洗时间,使他们有更多的精力集中在策略的研发上,极大提高投研效率。作为国内最早一个服务于量化投资的 Python 开源项目,目前用户超过 10 万,机构 300 家,已经成为量化投资领域比较常用或者借鉴的数据工具。

继续阅读“刘志明 | 知识图谱及金融相关”

鲍捷 | 知识表示——面向实战的介绍

本文转载自文因互联 2016 年 6 月份组织的第一期北京知识图谱学习小组 Wiki。


知识表示(Knowledge Representation,KR,也译为知识表现)是如何将结构化数据组织,以便于机器处理和人的理解的方法。从结构推导出新的结构,这就是推理。传统上KR属于逻辑的分支,但在实践中我们会用很简单、可读、可维护的数据结构。

经典的教科书中的 KR,主要关注的是如何方便机器处理。但是在现实的工程中,如何方便人的理解也是极为关键的。在工程实践中,人才是知识不能被处理好、不能快速交换、不能规模化的核心。

知识表现的瓶颈不在于机器处理能力的不足,而在于人的认知能力的不足。因此,我们在学习知识表现方法的时候,要始终牢记知识的可读性、可维护性要远远比它的表达力、计算速度重要。知识是为人阅读而设计的,只是偶尔被机器执行。

继续阅读“鲍捷 | 知识表示——面向实战的介绍”

领域应用 | 中医临床术语系统

本文转载自公众号中医药知识组织与标准。


什么是中医药术语系统?它是干什么用的呢?

中医药术语系统是运用计算机与信息技术等工具,对中医药学各领域中的事物、现象、特性、关系和过程进行标记和概括,并为每个概念赋予指称形成概念体系,具有管理中医药术语研究、制作、更新、维护等功能,根据不同需求形成系列术语管理体系,称为中医药术语系统。

目前中医药术语系统包括:中国中医药学主题词表、中医药学语言系统(包括古籍语言系统)、中医临床术语系统。

中医临床术语集是给计算机使用的,是为了解决中医临床数据在采集及信息传递过程中遇到的交流障碍,提高中医临床数据的利用率和知识的转化率而研制的一套术语系统。

继续阅读“领域应用 | 中医临床术语系统”

领域应用 | CCKS-2017 行业知识图谱构建与应用-上篇

本文转载自公众号PlantData知识图谱实战摘录自CCKS-2017(成都),王昊奋、胡芳槐演讲PPT《行业知识图谱构建与应用》的文章。


本次Tutorial主要包括以下三方面内容:

  1. 行业知识图谱概述,包括行业图谱简介,行业知识图谱的应用及挑战,以及行业知识图谱生命周期管理。

  2. 行业知识图谱关键技术,包括行业知识图谱生命周期中各过程的相关技术、现有可用的工具,以及各过程中的最佳实践及相关组件。

  3. 行业知识图谱应用实战,以金融证券行业应用为例,演示知识图谱从知识建模、知识抽取到行业应用的全过程。

继续阅读“领域应用 | CCKS-2017 行业知识图谱构建与应用-上篇”

领域应用 | 阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核

本文转自公众号阿里技术


阿里妹导读:借助阿里知识图谱的建设,阿里电商平台管控从过去的“巡检”模式升级为发布端实时逐一检查。在海量的商品发布量的挑战下,最大可能地借助大数据、人工智能阻止坏人、问题商品进入阿里生态。同时面临问题商家实时的对弈、变异和恶意攻击等诸多挑战,知识图谱仍然保持着每天千万级别的拦截量,亿级别的全量智能审核次数,在滥发、侵权、合规、假货、经营范围等多个场景全面与问题卖家正面交锋,实时对弈。为了最大限度地保护知识产权,保护消费者权益,我们对知识图谱推理引擎技术提出了智能化、自学习、毫秒级响应、可解释等更高地技术要求,实现良好的社会效益。

继续阅读“领域应用 | 阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核”

领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?

本文转载自公众号恒生技术之眼,作者为应雄,姜海军,楼承先。


近年来,由于金融科技(FinTech) 的迅猛发展,传统金融领域与金融科技的结合也越来越密切,金融科技产品如雨后春笋般涌现,人们对这些金融产品的关注和参与度也迅速高涨。然而现有的金融科技产品琳琅满目,与这些产品相关的资讯更是众多纷纭,人们要从这海量的资讯中获取自己关注和感兴趣的资讯变得极其繁琐和困难。推荐系统作为解决信息过载问题的有效手段之一,已被广泛应用于各个领域,该系统能够主动的向用户提供需求信息,让每个用户都能够得到具有针对性的推荐结果。然而现有的许多推荐算法存在没有考虑物品本身内涵知识的缺陷,导致对资讯内容分析的不完全和不精确,使得推荐效果不理想。本文的主要贡献在于提出了一个知识图谱和推荐系统的融合模型,在基于经典推荐算法基础上,充分考虑资讯本身内在的语义信息,利用资讯之间的标签关联关系,有效地提升了推荐算法的准确率、召回率和F值。

继续阅读“领域应用 | 从数据到智慧:知识图谱如何助力实现智能金融?”

领域应用 | 实事求是谈金融报告自动化

本文转载文因互联公众号,根据作者在某咨询公司的讲座整理。


三个迷信

在讲具体的技术之前,我想先说说关于人工智能的三个迷信。

第一个迷信,因为AlphaGo 战胜了围棋冠军,所以 AI 也可以做 XYZ(比如炒股)。可事实是,AlphaGo 只是 AI 的极小的一个分支。AI 总体还是处于“有多少人工就有多少智能”的水平。

第二个迷信,因为机器效率高,所以效率低的人会被机器消灭掉。我一开始也是这样想的,但是后来我发现并不是这样的。比如说计算器,计算器做加减乘除是比所有的人做得效率都高的。但会计并没有因为计算器而失业。恰恰相反,现在这个时刻,可能是人类历史上会计最多的一个时刻,未来还有可能更多。能被机器取代的,是完全的机械工作,就像工厂里的机器人那种工作,月工资2000块钱以下的那种工作。大多数的工作还是需要创造力的,至少需要有一部分的创造力。当机器提高了工作效率之后,实际上是使得拥有这种技能的人反而被增强了,而不是被替代了。所以在我看来,分析师肯定不会被机器替代掉,而是随着机器能力的上升,分析师的人数将来会越来越多。
继续阅读“领域应用 | 实事求是谈金融报告自动化”

鲍捷 | 知识图谱在金融领域的发展与应用

本文来自文因互联CEO鲍捷博士,2017年7月11日参加上海市——『信息化专家委沙龙——人工智能与知识管理』主题活动所做演讲。

活动介绍:

上海市信息化专家委员会成立于1999年,是为促进实施上海信息化发展战略而成立的高级专家组织,主要通过开展各类研究和咨询,为提高上海信息化发展质量和水平、提升上海城市综合竞争力提供智力支持。为积极拓展新型智库发展途径,信息化专家委与上海研究院加强深度合作,共同举办信息化专家委系列沙龙活动,集聚专家智慧,共商趋势热点。本期信息化专家委沙龙,将聚焦人工智能与知识管理领域,邀请企业、研究机构、政府部门的专家头脑风暴,开展讨论。

继续阅读“鲍捷 | 知识图谱在金融领域的发展与应用”