邹磊 | 浅谈知识图谱数据管理

本文转自北京大数据研究院 BIBDR 公众号。
近年来随着“人工智能”概念的再度活跃,除了“深度学习”这个炙手可热的名词以外,“知识图谱”无疑也是研究者、工业界和投资人心目中的又一颗“银弹”。简单地说,“知识图谱”就是以图形(Graph)的方式来展现“实体”、实体“属性”,以及实体之间的“关系”。 继续阅读“邹磊 | 浅谈知识图谱数据管理”

HiKnowledge | 大规模知识图谱数据存储实战解析

本文摘录自上海海翼知信息科技有限公司胡芳槐博士4月14日在北京理工大学分享的《大规模知识图谱数据存储》PPT。

作者对知识图谱的存储进行了全面的介绍,内容包括:什么是知识图谱,知识图谱的适用场景,知识图谱数据存储的几种常见方式和最佳方案,知识图谱中的时态信息及其存储实现,结合实例说明如何利用图数据库进行数据存储。

继续阅读“HiKnowledge | 大规模知识图谱数据存储实战解析”

鲍捷 | Web的50年——从Tim Berners-Lee的图灵奖说起

本文作者为文因互联 CEO 鲍捷,首发于文因互联公众号。

Tim Berners-Lee 昨天拿到了2016年度的计算机科学最高奖:图灵奖。他获得这个奖,实至名归。领域中人一直都认为他得奖只是时间问题。

Tim 的一生有两个伟大的贡献(当然,他还有很多其他的贡献):一、互联世界的文档,即万维网(Web)的发明及其规模化的努力,包括 W3C 的工作;二、互联人类知识的努力,包括语义网(Semantic Web)、互联数据(Linked Data)、开放数据(Open Data)、知识图谱(Knowledge Graph)等。第一个贡献已经广为人知,第二个贡献还在发展中,知道的人不多。但是我以为,第二个贡献将会是比第一个贡献更大的贡献。

继续阅读“鲍捷 | Web的50年——从Tim Berners-Lee的图灵奖说起”

陈华钧 | OpenKG:愿景与挑战

本文改编整理自浙江大学计算机科学与技术学院教授陈华钧在杭州首届金融知识图谱论坛上的报告。

 

关于论坛

首先作为承办方之一,也代表浙江大学,欢迎各位的到来。特别感谢白硕老师和所有的嘉宾百忙之中抽空过来支持这次论坛。

刚才桂林教授已经介绍过,我们组织这类论坛的一个主要目的是促进跨领域的交流,让知识图谱能更多的在垂直领域落地。传统的KG仍然局限于搜索引擎和Bot问答,并以百科类常识类知识图谱为主。但我们相信KG会逐渐渗透到更多的垂直领域。金融则是十分有希望也备受关注的垂直领域之一。

另外这次论坛,我和鲍捷还有一个目的是希望去宣传“开放”对于KG发展的重要性。丁力和鲍捷都是语义网和KG领域十分资深的专家,现在也都在创业。如果讲KG怎么构建,我们经常会去争论是该以Top-Down的方式去设计构建,还是该以Bottom-Up的方式从粗糙数据中去总结和抽取。我相信他们俩可以争论三天三夜。但有一件事情,特别是做语义网出身的朋友,我们不太会去争论,就是“开放”对于KG发展的重要性。实际上每一个真正深入到 KG 这个领域的人,都会或早或迟的意识到开放对于KG发展的价值和意义。

继续阅读“陈华钧 | OpenKG:愿景与挑战”

郭颖哲 | 如何运用知识图谱高效甄别一级市场资产

本文整理自 FellowPlus CEO 郭颖哲在杭州金融知识图谱论坛上的演讲。

我做过自媒体,做过 VC,现在在创业。我一直定义自己为 VC 投资人,但是有一颗段子手的心。另外一个联合创始人王亮,原来是友盟负责用户运营的一个朋友,他是个东北人,也有一颗段子手的心。所以我们其实是两个段子手,做了一个金融机构。

甄别一级市场资产的重要性

首先中国的一级市场,现状是爆发式的增长。主要体现在两个方面,一方面是投资并购的数量呈现井喷式增长,另一方面,是市场涌现了大量基金管理人。

继续阅读“郭颖哲 | 如何运用知识图谱高效甄别一级市场资产”

文飞翔 | 创投数据库的建设与商业场景探索

本文整理自 IT 桔子 CEO 文飞翔在杭州金融知识图谱论坛上的演讲。

这个主题,我相信在场的很多人已经非常熟悉了。我重点从以下五个方面介绍。刚才因果树的滕放也已经跟大家讲得非常详细,我会在他的基础上进行一些补充,特别是包括一些创业场景在内的案例。

 

继续阅读“文飞翔 | 创投数据库的建设与商业场景探索”

滕放 | 知识图谱在股权投资领域的尝试

本文整理自因果树创始人滕放在杭州金融知识图谱论坛上的演讲。

今天非常感谢大家来到浙大参加这个沙龙。首先我要感谢的是中文信息学会,能够让我们企业有这么一个平台跟大家交流;第二感谢的是浙江大学;最后感谢的是文因互联的鲍总。我们同业者能够聚在一起真的非常难得。我今天讲的是我的视角,跟各位专家不太一样。我们作为创业者,内心深处最大的愿望,是能够把我的企业做得更快、更好。所以今天我给大家分享的视角,是如何用技术来提高我们企业自身的、未来的竞争力。因为在过去大概十几年的经验里,我一直是在科技公司里面,但我对技术的理解是,技术绝对不是企业成功的最重要因素,技术可能占企业成功因素的 40%,剩下 60% 就在于如何利用技术找到相应的业务场景,让技术和业务相结合。你要有一个中间把控技术的进度。所以从这个方向给大家分享一下,我们因果树在过去两年多都做了什么事,以及为什么做这些事。

继续阅读“滕放 | 知识图谱在股权投资领域的尝试”

白硕 | NLP 与知识图谱的对接

本文整理自中国中文信息学会常务理事、白硕博士在杭州金融知识图谱论坛上的演讲,首发于文因互联公众号。

两个问题

第一个问题是,为什么有人说“中文知识图谱”,难道知识图谱是有国籍的吗?它是有母语的吗?知识是无国界的,这个当然是理论上的说法。具体到一个国度,一个语言文化的大环境,我们就会发现,事实上知识是有母语的。理论依据就是所谓的语言相对论。可能大家最近都看了《降临》,《降临》讲的就是语言相对论。一种思维方式、一种文化是被它的语言,它所操的母语所塑造。这是一个很重要的论断,也正因为这个,在英语世界里搞得非常好的一些技术,到汉语的世界来,就有可能水土不服。这给我们提出的任务,就不止是一个移植、汉化的问题。实际上与 NLP 的对接,就是知识处理。与 NLP 对接的这一块,任务比我们想象中重。语言的差距越大,亲疏关系离得越远,这个任务就越重。因为英语和德语之间不会那么费劲,法语跟意大利语之间也没有那么费劲,但是英语跟汉语之间,可能就是要费劲的。这与语言相对论是同样的道理。

继续阅读“白硕 | NLP 与知识图谱的对接”