Data Intelligence2019年发文目录

 

 

      Data Intelligence(DI)期刊在各界专家的支持下顺利完成了本年度出版工作。编辑部对已出版的文章进行了主题划分,并简述了每篇文章的内容,以飨关心和支持期刊发展的专家和读者。鉴于水平有限,主题分类和内容简述若有错误之处,敬请您不吝指正。

    衷心希望DI刊发的文章能启发您的研究,助力您的科研!

 

注:点击二维码可直达文章全文页面。

主编寄语

A Journal for Human and Machine

James Hendler, Ying Ding & Barend Mons

2019, vol.1: 1-5

https://doi.org/10.1162/dint_e_00001

简述:主编Jim Hendler教授、Ying Ding教授和顾问主编Barend Mons教授讲述了DI期刊的创建初衷、宗旨、定位以及长期发展方向。DI致力于发展成为同时支持人类和机器阅读的新型学术期刊。Jim Hendler被称为语义网之父,是美国轮勒斯理工学院教授,Ying Ding是美国得克萨斯大学奥斯汀分校教授,Barend Mons是FAIR原则的创立者,国际科学数据委员会CODATA主席,荷兰莱顿大学教授。

开放数据和FAIR科学

FAIR Science for Social Machines: Let’s Share Metadata Knowlets in the Internet ofFAIR Data and Services

Barend Mons

2019, vol.1: 22-42

https://doi.org/10.1162/dint_a_00002

简述:本文提出了FAIR数据和服务网络(IFDS)概念,号召共享元数据知识元,推动面向社会机器发展FAIR科学。作者BarendMons是FAIR原则的创立者,国际科学数据委员会CODATA主席,荷兰莱顿大学教授。

From Persistent Identifiers to Digital Objects to Make Data Science More Efficient

Peter Wittenburg

2019,vol.1: 6-21

https://doi.org/10.1162/dint_a_00004

简述:本文论述了对数字对象赋予永久标识符(PID)对于数据科学的意义。作者Peter Wittenburg是RDA欧盟主席。

Sustainability in Data and Food

Dean Allemang

2019, vol.1:43-57

https://doi.org/10.1162/dint_a_00005

简述:本文描述了生成、采集和管理农业科学数据的可持续性的全球管理框架,为解决与世界粮食生产有关的数据管理问题提供了创新的解决方案。作者Dean Allemang是语义网专家。

Toward Training and Assessing Reproducible Data

Bei Yu & Xiao Hu

2019, vol.1: 350-361

https://doi.org/10.1162/dint_a_00053

简述:本文以选修数据挖掘课程的大学生为调查对象,评估学生重用数据的能力和水平。通讯作者为香港大学教育学院信息与技术科学系博士生导师胡晓副教授。

Building a Holistic Taxonomy Model for OGD-Related Risks: Based on a Lifecycle Analysis

Fang Wang, An Zhao, Hong Zhao & Jun Chu

2019, vol.1: 309-332

https://doi.org/10.1162/dint_a_00018

简述:该文运用生命周期分析方法,选取不同国家的代表案例,对政府数据开放的风险构成、类型和分布进行了研究。本文通讯作者王芳是南开大学商学院信息资源管理系教授、博士生导师,网络社会治理研究中心主任,教育部“长江学者奖励计划”青年学者项目入选人。

Playing Well on the Data FAIRground: Initiatives and Infrastructure in Research Data Management

Danielle Descoteaux, Chiara Farinelli, Marina Soares eSilva & Anita de Waard

2019, vol.1: 362-379

https://doi.org/10.1162/dint_a_00020

简述:本文从出版社的角度探讨了开放科学数据的意义以及实践。作者均来自Elsevier出版社。

Paving the Way to Open Data

Yan Wu, Elizabeth Moylan, Hope Inman & Chris Graf

2019, vol.1:380-392

https://doi.org/10.1162/dint_a_00021

简述:本文介绍了Wiley出版社开放数据政策的制定以及实施操作。作者均来自Wiley出版社。

知识图谱构建和应用

Virtual Knowledge Graphs: An Overview of Systems and Use Cases

Guohui Xiao, Linfang Ding, Benjamin Cogrel & Diego Calvanese

2019, vol.1: 201-223

https://doi.org/10.1162/dint_a_00011

简述:虚拟知识图谱技术(VKG)也被称为基于本体的数据访问,本文详细总结了VKG的软件生态圈和应用案例。本文第一作者意大利博尔扎诺自由大学计算机学院Guohui Xiao (肖国辉) 博士,是当今最先进的VKG系统Ontop 研究团队的负责人,作者Diego Calvanese教授是知识图谱领域的国际知名专家。

Learning to Complete Knowledge Graphs with Deep Sequential Models

Lingbing Guo, Qingheng Zhang, Wei Hu, Zequn Sun & Yuzhong Qu

2019, vol.1: 224-243

https://doi.org/10.1162/dint_a_00016

简述:本文提出了一种新的知识图谱补全方法,通过扩展多层RNN将知识图谱建模成长度为3的序列,同时提出了3种不同策略来集成RNN单元,并通过实验展示了不同特点。本文通讯作者是南京大学计算机科学与技术系胡伟副教授。

Microsoft Concept Graph: Mining Semantic Concepts for Short Text Understanding

Lei Ji, Yujing Wang, Botian Shi, Dawei Zhang, Zhongyuan Wang & Jun Yan

2019,vol.1: 262-294

https://doi.org/10.1162/dint_a_00013

简述:本文详述了大型概念知识图谱系统——微软知识图谱 (Microsoft Concept Graph) 的构建实践。通讯作者为微软亚洲研究院纪蕾研究员。

Constructing a Scene-Based Knowledge System for E-Commerce Industries: Business Analysis and Challenges

Min Fu, Qiang Chen, Wei Lin, Pei Wang & Wei Zhang

2019,vol.1: 295-308

https://doi.org/10.1162/dint_a_00012

简述:本文详述了阿里巴巴集团构建的基于场景的知识系统,从商业角度分析该系统的优势和面临的挑战。本文通讯作者为阿里巴巴集团付敏高级工程师。

Knowledge Graph Construction and Applications for Web Search and Beyond

Peilu Wang, Hao Jiang, Jingfang Xu & Qi Zhang

2019, vol.1: 333-349

https://doi.org/10.1162/dint_a_00019

简述:本文介绍了搜狗公司构建大规模多源数据知识图谱的案例。作者均来自于搜狗公司。

知识平台、知识系统和语义资源

GeoLink Data Set: A Complex Alignment Benchmark from Real-world Ontology

Lu Zhou, Michelle Cheatham, Adila Krisnadhi& Pascal Hitzler

2019, vol.2: 323-348

https://doi.org/10.1162/dint_a_00054

简述:本文构建了用于本体匹配的来自于GeoLink 项目的真实数据集。本文第一作者来自于堪萨斯大学计算机系Pascal Hitzler教授团队。Pascal Hitzler教授是语义网领域国际知名学者,Semantic Web 期刊的创刊主编(Founding Editor-in-Chief) 。

The Computer Science Ontology: A Comprehensive Automatically-Generated Taxonomy of Research Areas

Angelo A. Salatino, ThiviyanThanapalasingam, Andrea Mannocci, Aliaksandr Birukou, Francesco Osborne & Enrico Motta

2019,vol.2: 349-386

https://doi.org/dint_a_00055

简述:本文详述了计算机科学本体(Computer Science Ontology)的自动构建过程。该本体包括1.4万个主题,12.2万条语义关系。本文通讯作者Angelo A. Salatino是英国开放大学知识媒体研究所的教授,Francesco Osborne是语义网领域的国际知名青年学者。

Refining Linked Data with Games with a Purpose

Irene Celino, Gloria Re Calegari & Andrea Fiano

2019,vol.2: 387-412

https://doi.org/dint_a_00056

简述:本文构建了嵌入众包任务以优化关联数据的开源软件游戏框架。本文通讯作者Irene Celino为意大利Cefriel公司知识技术团队负责人,是语义网技术和人机对话技术领域国际知名学者。

AMiner: Search and Mining of Academic Social Networks

Huaiyu Wan, Yutao Zhang, Jing Zhang & Jie Tang

2019, vol.1:58-76

https://doi.org/10.1162/dint_a_00006

简述:AMiner是一个新型的由作者、论文、会议、期刊以及机构所组成的大规模在线学术搜索与挖掘系统。本文第一作者是北京交通大学万怀宇副教授,通讯作者唐杰教授是国内知名学者、清华大学计算机科学与技术系教授,国家杰出青年科学基金获得者。

XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application

Hailong Jin, Chengjiang Li, Jing Zhang, Lei Hou, Juanzi Li & Peng Zhang

2019, vol.1: 77-98

https://doi.org/10.1162/dint_a_00003

简述:本文介绍了基于维基百科和百度百科自动构建的XLORE升级版的构建和应用。本文为清华大学计算机科学与技术系李涓子教授团队的最新研究成果。李涓子教授目前是中国中文信息学会语言与知识计算专委会主任、清华-青岛数据科学研究院科技大数据研究中心主任。

KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems

Wayne Xin Zhao, Gaole He, Kunlin Yang, Hongjian Dou, Jin Huang, Siqi Ouyang & Ji-Rong Wen

2019, vol.1: 121-136

https://doi.org/10.1162/dint_a_00008

简述:本文展示了数据集KB4Rec v1.0。该数据集将三个广泛使用的推荐系统数据集的物品链接到两个流行的知识图谱—FreeBase和YAGO。本文通讯作者为中国人民大学信息学院赵鑫副教授。

CN-DBpedia2: An Extraction and Verification Framework for Enriching Chinese EncyclopediaKnowledge Base

Bo Xu, Jiaqing Liang, Chenhao Xie, Bin Liang, Lihan Chen & Yanghua Xiao

2019,vol.1: 244-261

https://doi.org/10.1162/dint_a_00017

简述:本文提出了一种抽取加验证的知识库增强框架。相比CN-DBpedia,新版本的知识库(CN-DBpedia2)增加了大量从实体描述文本中抽取出来的高置信度的事实。本文通讯作者肖仰华是复旦大学计算机学院教授、博导、青年973首席科学家。

自然语言处理和数据评测竞赛

Joint Entity and Event Extraction with Generative Adversarial Imitation Learning

Tongtao Zhang, Heng Ji & Avirup Sil

2019, vol.1: 99-120

https://doi.org/10.1162/dint_a_00014

简述:本文针对传统方法中将实体和事件作为多分类问题并只注重提高正确类别概率的现状,引入了强化学习中“奖励”的概念来估算对计算结果的奖励和惩罚,通过用比较强烈的惩罚使系统做出正确决定的方式提升模型质量。本文通讯作者Heng Ji(季恒)是美国伊利诺伊大学香槟分校教授,自然语言处理领域国际知名青年学者。

User Profiling for CSDN: Keyphrase Extraction, User Tagging and User Growth Value Prediction

Guoliang Xing, Hao Gao, Qi Cao, Xinyu Yue, Bingbing Xu, Keting Cen & Huawei Shen

2019, vol.1: 137-159

https://doi.org/10.1162/dint_a_00015

简述:本文详述了中国科学院计算技术研究所团队在第六届全国社会媒体处理大会(SMP CUP 2017)用户画像技术评测竞赛获胜的策略。通讯作者沈华伟为中国科学院计算技术研究所研究员、中国中文信息学会社会媒体处理专委会副主任。

Identifying User Profile by Incorporating Self-Attention Mechanism based on CSDN Data Set

Junru Lu, Le Chen, Kongming Meng, Fengyi Wang, Jun Xiang, Nuo Chen, Xu Han & Binyang Li

2019, vol.1: 160-175

https://doi.org/10.1162/dint_a_00009

简述:本文记述了国际关系学院团队在第六届全国社会媒体处理大会(SMP CUP 2017)用户画像技术评测竞赛中获胜的UIR-SIST系统。通讯作者为国际关系学院信息科技学院李斌阳副教授。

MDKB-Bot: A Practical Framework for Multi-Domain Task-Oriented Dialogue System

Yadi Lao, Weijie Liu, Sheng Gao & Si Li

2019,vol.1: 176-186

https://doi.org/10.1162/dint_a_00010

简述:本文记述了北京邮电大学团队在第六届全国社会媒体处理大会(SMP CUP 2017)人机对话技术评测竞赛中获胜的Multi-Domain KB-BOT (MDKB-BOT)系统。通讯作者为北京邮电大学信息与通信工程学院高升副教授。

An Evaluation of Chinese Human-Computer Dialogue Technology

Zhengyu Zhao, Weinan Zhang, Wanxiang Che, Zhigang Chen & Yibo Zhang

2019, vol.1: 187-200

https://doi.org/10.1162/dint_a_00007

简述:本文介绍了SMP2018中文人机对话技术评测任务以及评测数据集,并对评测结果和目前中文人机对话所存在的问题做出了简析。通讯作者是哈尔滨工业大学计算机学院张伟男副教授,其他作者来自哈尔滨工业大学计算机学院,科大讯飞人工智能研究所和华为消费者事业部智能工程部。

发表评论

邮箱地址不会被公开。 必填项已用*标注