首页 >> 图书情报学
黄如花等:科学数据开放存取途径
2017年07月19日 09:26 来源:《图书馆》 作者:黄如花 刘龙 陈萌 字号

内容摘要:文章详细论述了科学数据开放存取的多种途径,包括利用数据检索工具,访问Dataverse仓储,访问相关组织或机构的开放数据站点,查阅开放存取仓储注册系统或目录,查阅开放数据期刊,利用综合性搜索引擎等,以期为用户查找并获取科学数据提供一些参考。

关键词:科学数据;研究数据;开放存取;途径

作者简介:

    原题:科学数据开放存取的途径

  作者简介:黄如花,女,博士生导师,武汉大学信息资源研究中心教授;刘龙,男,武汉大学信息管理学院博士研究生。武汉 430072;陈萌,女,武汉音乐学院图书馆馆员。武汉 430060

  内容提要:文章详细论述了科学数据开放存取的多种途径,包括利用数据检索工具,访问Dataverse仓储,访问相关组织或机构的开放数据站点,查阅开放存取仓储注册系统或目录,查阅开放数据期刊,利用综合性搜索引擎等,以期为用户查找并获取科学数据提供一些参考。

  关 键 词:科学数据 研究数据 开放存取 途径

  标题注释:本文系中国科学技术信息研究所与武汉大学信息管理学院合作项目“科学文献的语义功能识别与深度利用”的研究成果之一。

  科学数据是指各类科技活动产生的原始性、基础性的数据及其分析研究信息,是国家创新体系中最活跃的要素之一[1],无论对经济发展、政府决策、科技创新还是科学研究都具有重要意义。科学数据的开放存取越来越受到世界各国的重视,根据相关统计,截至2015年11月27日,在调查的全球157个科研资助机构中,有60个出台了要求或鼓励研究数据开放存取的政策[2]。2015年更是被称为“开放数据授权年”(The Year of Open Data Mandates)[3],一大批机构在该年出台了科学数据开放存取的政策。美国国家科学基金会(National Science Foundation,简称NSF)分别于2015年3月和7月发布《国家科学基金会公共获取计划:今天的数据,明天的发现》(NSF’S PUBLIC ACCESS PLAN:Today’s Data,Tomorrow's Discoveries)[4]和开放政府计划3.5(Open Government Plan3.5)[5],以促进其资助的科学数据等研究成果的开放获取;欧盟于2015年10月颁布了推动研究数据开放获取的文件《地平线2020:科学出版物和研究数据开放获取指南》(Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020)[6];英国工程和自然科学研究委员会(EPSRC)制定的《EPSRC研究数据政策框架》(EPSRC Policy Framework on Research Data)于2015年5月1日正式生效[7];我国国务院发布的《促进大数据发展行动纲要》也明确提出积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享[8]。

  开放存取政策的出台为科学数据的开放存取提供了条件。但由于缺少跨机构和地域性的一站式检索站点,公开可用的科学数据散布在众多独立的组织或机构站点中,导致用户很难从纷繁复杂的各类数据存储站点中找到自己所需的科学数据,因此了解和掌握科学数据开放存取的途径就变得尤为重要。本文介绍了多种科学数据开放存取的途径,可以为用户查找和获取科学数据提供一些帮助。

  1 利用数据检索工具

  数据检索工具可用于直接检索特定的科学数据资源,用户只需输入相应的检索词即可得到准确的检索结果,是最为快捷、方便的科学数据查找途径。DataCite[9]、CrossRef[10]、Zanran[11]、Voovle[12]以及Google Public Data Explorer[13]等都可算是这类工具的典型代表。本文选取DataCite元数据搜索、CrossRef元数据搜索和Zanran来进行介绍,其中前两者分别隶属于全球最大的两家DOI(数字对象标识符)注册、发布机构DataCite与CrossRef,可分别检索在这两个机构注册的数据集,Zanran是一个专门用于查找数值型数据(Numerical Data)搜索引擎,功能非常强大。

  1.1 DataCite元数据搜索

  DataCite元数据搜索(DataCite Metadata Search)是一个通过搜索数据集在Datacite上注册的关键词、日期、位置等相关元数据信息,来查找和获取某些特定数据集的数据检索工具。Datacite作为一个帮助研究者发现、识别和引用研究数据的非营利性机构,目前已注册了大量的研究数据集,用户可利用DataCite元数据搜索来获取所需的科学数据。

  DataCite元数据搜索提供简单检索和高级检索两种检索方式,并且给出了详细的使用方法。使用简单检索时,用户只需输入DOI或相关元数据,如题名、主题等作为检索词,点击检索按钮即可;使用高级检索时,用户可从DOI、标题、创建者、出版者、贡献者、格式、主题、日期等13个字段中选择输入一个或几个进行检索,同时还可根据数据中心、资源类型和语言等进行检索过滤。

  1.2 CrossRef元数据搜索

  CrossRef元数据搜索(Crossref Metadata Search)可通过元数据来检索Crossref数据库的资源。CrossRef是一个旨在促进学术成果内容更容易被发现、链接、引用和评定的非营利性会员组织,截至2015年11月21日,其数据库收录的资源记录已超过7700万个,其中很多为研究数据。目前仅提供简单检索这一种检索方式,用户可通过输入作者、标题、DOI、ORCIDs、ISSNs、FundRefs等元数据信息来进行检索,检索页面给出了多种查询示例以帮助用户进行操作[14],例如输入DOI“10.2331/suisan.32.804”来查找某一特定的学术成果。

  1.3 Zanran

  Zanran是一个专门用来查找数值型数据(Numerical Data)的搜索引擎,可帮助用户找到网络上半结构化的开放数据,格式包括PDF、Excel、HTML Tables和Images等,比如他人发表的PDF格式的图表、EXCEL格式的表格、图片或HTML格式的条形图等,其中很多是研究论文中的数值型数据。相比综合性搜索引擎,Zanran检索结果更为精确,而且操作也更为简单,Zanran会在搜索框中给出检索提示,用户根据提示可以很容易地构造出标准的检索式,提高检准率。除此之外,用户还可以在输入检索词的同时选择地区(如澳大利亚、加拿大等,也可以是特定的网址)、日期(所有日期、最近6个月、最近12个月、最近24个月)和文件类型(PDF、Excel、HTML Tables、Images)等进行限定,进一步精确检索结果。因此,利用Zanran进行检索是一种非常便捷、高效地获取科学数据的途径。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们