本文转载自公众号:中国中文信息学会。
2019 年全国知识图谱与语义计算大会(CCKS 2019)于 8 月 24 日至 27 日在杭州召开,由中国中文信息学会语言与知识计算专业委员会主办,浙江大学承办。本次会议主题是“知识智能”。大会吸引了来自海内外的八百多名科研学者、工业界专家和知名企业代表参加。会议回顾了知识图谱与语义计算的进展情况,探讨了领域内的新发现、新技术和新应用,旨在让社会各界了解知识图谱与与语义计算的新方向和新趋势,以推动我国语言与知识计算领域的进一步发展。
开放的知识图谱社区
本文转载自公众号:中国中文信息学会。
2019 年全国知识图谱与语义计算大会(CCKS 2019)于 8 月 24 日至 27 日在杭州召开,由中国中文信息学会语言与知识计算专业委员会主办,浙江大学承办。本次会议主题是“知识智能”。大会吸引了来自海内外的八百多名科研学者、工业界专家和知名企业代表参加。会议回顾了知识图谱与语义计算的进展情况,探讨了领域内的新发现、新技术和新应用,旨在让社会各界了解知识图谱与与语义计算的新方向和新趋势,以推动我国语言与知识计算领域的进一步发展。
笔记整理:王若旭,浙江大学在读硕士,研究方向为关系抽取,零样本学习。
本文发表于 www2019,参考链接:https://arxiv.org/pdf/1905.04413.pdf
为了解决推荐系统中协同过滤方法面对的数据稀疏和冷启动的问题,很多研究者将关注点放在 user 和 item 的属性上,通过设计一些算法来探索这些辅助信息。本篇文章基于属性之间并非独立的观点提出 Knowledge Graph Convolutional Networks (KGCN),通过挖掘 item 在 KG 属性上的关系有效地捕获item内部的联系。
JIST 2019 Posters and Demonstration complement the full papers of the conference and offer an opportunity for presenting late-breaking research results, ongoing research projects, and speculative or innovative work in progress. Poster and Demo presentations allow researchers to present and toreceive direct feedback from audience about significant work in progress, bleeding-edge work, or research that is best communicated in an interactive orgraphical fashion.
JIST 2019 cordially invites proposals for workshops to beheld in conjunction with the conference. The purpose of a workshop is to provide an opportunity for participants for in-depth discussions of current and emerging topics of semantic and related technologies. Ideally a workshop should foster interactions between different communities within the scope of JIST.
The organisers of an accepted workshop will be responsible for preparing & disseminating call for papers, organising the reviewing process, the workshop website, and proceedings publication of papers accepted at the workshop.
A workshop proposal should include the following information
* Title and short description of the workshop.
* A list of organisers of the workshop with their brief biography.
* Your preference regarding the length of the workshop: half-day or full-day.
Important dates
* Submission due: 23:59 (Hawaii Time) 9 September,2019
* Acceptance Notification: 16 September, 2019
* Announcement of Call for Paper for Accepted Workshops: 18 September, 2019
Recommended Schedule for workshops
* Paper submission due: 23:59 (Hawaii Time) 5 October, 2019
* Notification of Acceptance: 26 October, 2019
* Camera-ready Deadline: 2 November, 2019
* Workshop day: 25 or 27 November, 2019
Proposals should be submitted via Email: jist2019@163.com.
Workshop Chairs
* Yuan-Fang Li, Faculty of Information Technology, Monash University, Australia
* Xianpei Han, Institute of Software, Chinese Academy of Sciences, China
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。
来源:EMNLP 2018
链接:https://www.aclweb.org/anthology/D18-1034
问题背景与动机
本文关注小语种/资源匮乏语言的跨语言命名实体识别问题,首先作者肯定了现有无监督/弱监督方法在单语资源丰富的情况下能够取得不错的性能。但是对于单语资源不足的情况下,这些方法却无法适用,原因在于:无监督方法需要构建单语embedding并投影到共享空间中,但是单语资源不足的情况下,无法构建有质量的embedding;弱监督方法则需要使用一定规模(10K~1M)的双语词典作为语言对齐的seed,显然这个要求对于小资源语言(如维吾尔语)也是相对苛刻了。
为了解决这一问题,作者提出结合词典方法与embedding方法,利用微量平行数据(<10K)构建embedding,将丰富资源的英语数据与微量资源的小语种词汇投影到共享空间中,而后利用近邻方式构建规模更大的双语词典,再利用双语词典将英语数据word-by-word译为小语种数据,用于NER模型的训练。同时,考虑到这种方法产生的语言距离真实的自然语言表达存在差异,作者在NER模型中引入self-attention试图减缓这种影响
贡献
1. 提出了一种通过语言迁移实现的跨语言NER策略
2. 提出一种 order-invariant self-attention 机制用于缓解语言迁移以及数据量不足对 NER 模型产生的影响
方法说明
本文的方法过程描述如下:
1. 使用单语语料独立训练两种语言的 embedding 单语嵌入使用的方法类似 (Mikolovetal., 2013b; Pennington et al., 2014; Bojanowskiet al., 2017)等人的工作,利用单语文本训练嵌入矩阵。
2. 利用给定的微量双语字典,将上述两种语言的embedding投影到一个共享空间中投影方法,采用的是 (Zhang et al., 2016; Artetxe et al., 2016; Smithet al., 2017) 等类似的方式,通过训练投影矩阵,实现将两种语言的 embedding 投影
3. 对于单语资源丰富的英语embedding,利用最近邻策略,挑选另一语言的词语的embedding作为其翻译结果,从而构建较大规模的双语字典在计算embedding相似度方面,采用cross-domain similarity local scaling (CSLS) metric(Lample et al., 2018)实现。
4. 利用3中的翻译将英语命名实体识别语料译为另一语言,同时保留命名实体标签,用于NER模型的训练
下图是上述过程的一个示意,语言对为英语-西班牙语:
模型
NER模型方面,作者采用了一个分层神经网络+self-attention+CRF的序列标注方案:其中输入粒度被细化到了char级,每个单词的字母都通过双向RNN融合得到,此基础上再通过一层双向RNN做词级别的embedding,之后使用self-attention对得到的每个词的embedding做一步转换得到embedding_a,而后将embedding与embedding_a进行组合,得到用于训练CRF序列标注过程的单词表示。
实验
数据集
实验数据方面,作者采用了CoNLL 2002以及2003 NER公开数据集,其中包含英德荷及西班牙语共四种语言,通过将英语与其他三种语言组合为“资源丰富-资源缺乏”的语言组合,构建出上述方法所需的数据形式。
实验结果
表1 反映了本文方法在公开数据集上的实验,采用F1值作为评价指标,结果上看,相对其他同类模型,本方法的性能提升较为显著。
同时作者也针对embedding过程的效果进行统计评判,这种使用近邻进行翻译的方法,在双语性能上表现出了一定提升。
同时作者也对小语种维吾尔语进行了NER实验对比,在无额外知识补充的且使用微量平行数据的情况下,本文增量模型的性能提升还是比较明显。但是整体结果上,相对目前最好的模型差距还是是否明显,作者认为产生这一情况的原因在于维吾尔语极低的单语质量,且英语和维吾尔语之间的天然差异本身就非常的大。
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
以下文章来源于知识工场 ,作者蒋海云
知识工场
知识工场依托复旦大学等研究机构专注于各类知识图谱构建、管理与应用理论及关键技术研究。知识工场以构建能够满足机器语言认知需要的大规模、高质量知识图谱为基本目标,并以推进知识图谱在文本理解、智慧搜索以及机器智脑等领域中的深入应用为主要使命。
本文转载自公众号:知识工场。
作者:蒋海云,复旦大学2016级计算机博士生,研究方向为知识图谱与自然语言处理。目前已在 IJCAI,AAAI,ACL,DASFAA等会议上发表文章。
IJCAI 2019(The 28th International Joint Conference on Artificial Intelligence)将于当地时间8月10日至8月16日在中国澳门举行。作为人工智能领域最顶级的国际学术会议之一,本次会议投稿量有 4752 篇,接收率为 17.8%。知识工场实验室发表“关系抽取”相关论文一篇,名为《Relation Extraction Using Suervision from Topic Knowledge of Relation Labels》,以下为具体内容:
Michael Galkin 开放知识图谱 2019-08-14
本文转载自公众号:AI科技评论。
ACL 2019 已经结束,但其空前的规模仍然震撼人心:2900多篇提交论文,660篇被接收,3000多名会议注册人员,以及4个超过400人的研讨会(比一些国际CS会议都大)。
第 9 届国际语义技术联合会议 JIST2019 将于今年 11 月在美丽的杭州召开,投稿截止日期延迟至 9 月 8 日。现在征集优秀的研究论文,本届会议还专门设置了 special session track,优秀论文将被推荐到 SCI 期刊发表,目前已申请到 Semantic Web Journal (IF 3.524)和 Journal of Big Data Research (IF2.952)的 special issue,敬请赐稿!
【JIST历史】JIST 会议的历史要追溯到 2006 年在北京召开的第 1 届亚洲语义网会议 ASWC,第 5 届 ASWC2011 在杭州召开时改名为第 1 届国际语义技术联合会议 JIST2011,9年后 JIST2019 再次回到杭州。
Call for Papers: JIST 2019 Regular Technical Papers
JIST2019: The 9th Joint International Semantic TechnologyConference
Nov. 25-27, 2019, Hangzhou,China.
http://jist2019.openkg.cn/
The Joint International Semantic Technology Conference (JIST) is a joint event for regional Semantic related conferences. Since launched at Hangzhou in 2011, it has become the premium Asian forum on Semantic Web, Knowledge Graph, Linked Data and AI on the Web. The mission of JIST 2019 is to bring together researchers in the Semantic Technology research community and other areas of semantic-related technologies to present their innovative research results or novel applications of semantic technologies.
There are two tracks in JIST 2019.
Research Track
JIST 2019 research track solicits submissions of original research work on semantic technologies. Topics of interest include, but are not limited to:
Special Session Track
JIST 2019 special session track to discover and implement special topics that researchers in Semantic Technology are particularly interested in. We also intend to facilitate participation of potentially-related researchers in the JIST conference. Topics of special sessions are as follows:
Important Dates
Submission
Submissions to JIST 2019 should describe original, significant research on semantic technologies. JIST 2019 will not accept submissions that are under review for or have already been published in or accepted for publication in a journal or another conference (*).
* Non peer-reviewed documents such as theses, tech reports, publications on preprint server (e.g. arXiv.org) are not considered prior publications. Thus JIST2019 authors are not precluded to submit papers on the same topic by the same authors.
Submissions to JIST 2019 are expected to present their claimed contribution, with clear evidence to support their claims.
All submissions will be critically reviewed by at least three members of the program committee of either research track or special session track. To assess submissions, reviewers will judge their relevance to semantic technologies, their originality, the technical soundness of their proposed approach and the readability of the submission.
JIST 2019 submissions are not anonymous.
Submissions must be in PDF format, using the style of the Springer Publications format for Lecture Notes in Computer Science (LNCS). Regular paper submissions must be no longer than 16 pages, and short paper submissions must be no longer than 8 pages. Submissions that exceed this limit may be rejected without review.
Accepted papers of both research track and special session track will be published in an LNCS proceedings. At least one author of each accepted paper must register for the conference and present the paper there.
Papers can be submitted electronically via EasyChair (via https://easychair.org/conferences/?conf=jist2019). Please select the corresponding track(s) when you submit your paper(s).
Recommendation to Journal
A number of best papers accepted at JIST 2019 will be invited to present at the Meet the Editor session of SCI indexed journals, including Semantic Web Journal (IF 3.524), Journal of Big Data Research (IF2.952), and Data Intelligence, for fast-track publication in special issues in these journals.
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
JIST 2019: The 9th Joint International Semantic Technology Conference
Nov. 25-27, 2019, Hangzhou, China.
http://jist2019.openkg.cn/
第 9 届国际语义技术联合会议 JIST 2019 将于今年 11 月在美丽的杭州召开,投稿截止日期临近 (Abstract submission: 23:59 (Hawaii Time), 10 August, 2019 Full paper submission: 23:59 (Hawaii Time), 17 August, 2019)现在征集优秀的研究论文,本届会议还专门设置了 special session track,优秀论文将被推荐到 SCI 期刊发表,目前已申请到 Semantic Web Journal (IF 3.524) 和 Journal of Big Data Research (IF2.952) 的 special issue,敬请赐稿!