白雪 | NLP加持知识图谱在金融事件挖掘中的应用

本文转载自公众号:阡寻科技

9月15日讯,涵盖金融科技、人工智能及区块链领域的2018恒生技术开放日于今日开幕,阡寻科技联席CEO、复旦大学人工智能方向博士白雪受邀出席本次大会,分享了金融领域事件特点分析、常用的事件抽取方法以及金融知识图谱加持NLP等方面的实践与心得。与参会人员共同探讨了自然语言与知识图谱未来的发展方向,并对人工智能技术在金融领域的应用进行了展望。

【金融领域事件特点分析】

资本运作,并购、高管动向等事件会对金融产品价格产生冲击,这些事件会引发股票、期货等金融产品价格的波动,并且由于各方对事件解读的观点不同,对标的价格也会产生不同的影响,故需要对这些事件进行特点分析,通过文本数据解析与语义理解,从多维度建立立体的关联关系,来满足投资者对事件更快、更全、更准确的挖掘需求。

 

【常用的事件抽取方法】

事件抽取是对文本进行预处理、触发词抽取与论元识别等步骤后,从非结构化信息中抽取出特定的元素,并以结构化的形式呈现给用户。白博士向大家展示了事件抽取的大致流程,首先以基于规则或机器学习的方法来判断句子的属性,然后抽取事件骨干,同时围绕同一事件可能存在的多个表达句子,用实体对齐、同义词对齐等手段进行泛化,再通过抽取公共子串或“填坑”的方式来“拼凑”完整的事件表达式。

 

【金融知识图谱加持NLP】

金融行业产业链上的各元素之间存在着一定的逻辑关系,这些相近的元素可以从词库的扩充,子图近邻的相似等方面,进行语义理解与词法分析处理,对NLP进行加持与助力,进一步的,还能基于图谱路径进行事件的关联和推理。知识图谱在场景识别、关联查询、交叉验证等各种NLP和AI任务上都能起到积极作用。

在事件沿知识图谱的推理上,白博士以泰国特大洪水与新能源汽车销量上涨,分别对橡胶行业和下游碳酸锂电池生产企业股价的影响为例,分析了沿知识图谱多步推理的原理,此项技术在金融投资领域具有广泛的需求,可帮助人们及时发现投资机会与潜在风险。

白博士坦言NLP+知识图谱、事件抽取和推理等方向,尚处在研发应用初级阶段,未来发展空间很广,仍需大家不断的努力。

阡寻科技将深度发掘自然语言与知识图谱在金融科技、工业智能化、监管科技领域的应用,为市场带来股票对话机器人、事件预警、智能资讯、自动报告、智能公告、知识图谱构建与推理、智能矿山系统等多种产品,打造一个全方位覆盖行业产业链的数字信息平台。

OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

发表评论

电子邮件地址不会被公开。 必填项已用*标注