生物多样性数据的人
任务组章程(TDWG归因兴趣集团下)
提交:2020年1月13日
上次更新:5月18日,2020年
召集人
大卫斯特克斯(加拿大农业和农业食品加拿大)
昆汀新郎(Meise Botanic Garden,Belgium)
伊丽莎白·m·Haston(英国爱丁堡皇家植物园)
安妮瑟文(美国俄勒冈州立大学)
成员列表
安东Guntsch(Freie Universität柏林,德国)
ChloéBesombes.(法国巴黎国家自然历史博物馆)
DominikRöpert.(植物园和植物博物馆柏林)
Frederik Berger.(德国柏林自然科学博物馆)
虹膜sampaio.(亚速尔大学/米尔森肯堡分校)
雅罗西克弗兰克(国家博物馆,布拉格,捷克共和国)
谢里夫伊斯兰教(自然的、荷兰)
乔纳森Krieger(皇家植物园,Kew,英国)
尼基Nicolson(皇家植物园,Kew,英国)
妮可·卡尼(澳大利亚生物多样性遗产图书馆)
保罗布劳恩(卢森堡国家自然历史博物馆)
罗伯特卫生间(英国爱丁堡皇家植物园)
罗纳德卡佩(美国佛罗里达大学iDigBio)
杆页面(格拉斯哥大学)
莎拉·菲利普斯(皇家植物园,Kew,英国)
西蒙Chagnoux(法国巴黎国家自然历史博物馆)
deborah l保罗(伊利诺斯州自然历史调查,香槟-厄巴纳,伊利诺斯州,美国)
当前的活动
在GBIF命名空间下创建了两个术语,以用于发生数据中人员的标识符交换。这些是recordedByID和identifiedByID并可在GBIF的集成出版工具包的核心Darwin核心发生扩展中获得。它们的定义如下:
| recordedByID | |
|---|---|
| 定义 | 代表负责录制原始事件的人员,组或组织的名称的IDS的无序列表(连接和分开)。不应假设任何语义,包括例如标识符的排序,以指示主要收集器或任何机构联系。推荐的最佳实践是用竖条(|). |
| 例子 | https://orcid.org/0000 https://orcid.org/0000 - 0001 - 6215 - 3617 | 0003 - 1691 - 239 xhttps://orcid.org/0000 - 0001 - 6215 - 3617 | https://www.wikidata.org/entity/Q28913658 |
| Qualname | http://rs.gbif.org/terms/1.0/recordedbyid. |
| identifiedByID | |
|---|---|
| 定义 | 一个无序的id列表(连接和分离的),表示将Taxon分配给主题的人员、组或组织的名称。不应假定语义,例如,包括按引用优先级或任何机构联系排序的标识符。推荐的最佳实践是用竖条(|). |
| 例子 | https://orcid.org/0000 https://orcid.org/0000 - 0001 - 6215 - 3617 | 0003 - 1691 - 239 xhttps://orcid.org/0000 - 0001 - 6215 - 3617 | https://www.wikidata.org/entity/Q28913658 |
| Qualname | http://rs.gbif.org/terms/1.0/ ideediedbyid |
这个小组的成员正在开发达尔文核心的扩展项目,代理行为.这个扩展容纳理论上与研究数据联盟合作生产。
动机
- 生物多样性研究需要人的唯一标识来连接实体。这些实体包括出版物、标本、分子序列、分类名称和概念、项目、代码、工作流和观察
- 我们可以使用像ISNI、ORCID和Wikidata这样的组织和/或项目,这些组织和/或项目是稳定的,他们的解决方案服务有望被永久维护
- orcid ID在学术出版物中迅速采用了人员识别。Wikidata正在将分类学名称链接到人们标识符,不属性主义者允许Orcid ID识别观察员。标本数据落后,即使有明确的需求
- 研究人员和收藏经理希望有一个信用系统,承认他们在保存和收藏标本方面所做的努力
- 公民科学家希望找到一种方法来追踪他们的努力所产生的影响
- 集合管理系统通常将人建模为agent,但很少容纳外部标识符,没有一个具有明确共享属性数据的机制
- 如何在如何最佳提取,协调和解决事件和出版物中的名称中进行研究,我们了解这将鼓励重点协调,并将减少数字化计划中的重复(Nicolson&Tucker,2019; Nicolson等,2018)
- 我们在研究数据联盟和生物多样性信息标准中制定了一份发布的模型,这些标准可以用作共享归属数据中的指导原则(Thessen et.al。2019)历史和背景
任务组的许多参与者都从事人员标识符和个人数据的工作。我们认为,现在是时候将这些倡议汇集在一个任务小组之下,以创建共同的标准、共同的方法和最佳实践。
2019年3月,在调动费用行动下,讲习班就“人民名称权限管理”的主题进行了研讨会https://osf.io/qwegk/.该研讨会制定了一些行动,并在2019年10月生物多样性下一次会议的会前研讨会上取得了进展。在讲习班上,与会者致力于可视化、消除歧义、参与和传播收藏的人标识https://osf.io/9t3f2/.
目标
- 确定达尔文核心是否必须被修改并随后批准,以适应我们的信息的更细粒度的表示,如recordedBy, identiedby, georereferencedby, measurementDeterminedBy
- 建立达尔文核心延期草案,以获得用户反馈的归属
- 建立uri绑定到的操作词汇表体内1(与安妮·特森合作)
- 在动作词汇表中开发多种语言中的定义
- 将扩展与现有扩展和他们记录代理及其行为的扩展
- 试点使用2-3博物馆和植物豆花的扩展实施,通过集成的发布工具包(IPT)提供数据
- 从GBIF的扩展名注册表中服务
- 提倡并说服在集合和其他相关计划中为代理及其操作使用全局唯一标识符。例如,在收集管理系统中。
- Develop a 3-4 page rationale with costs and benefits for seeking formal TDWG/GBIF membership with ORCID and/or ISNI [International Standard Name Identifier] (ISNI and ORCID work together but don’t cover the same groups of people; ORCID for living, ISNI for dead). Audience: GBIF heads of delegations, governing board
- 为在标本上写的人民名字的歧义做出最好的实践指南。
- 确定在TDWG中与其他利益集团有重叠的领域
- 提出改进工作流程的建议,如数据质量兴趣小组
方法
任务组将使用在线手段进行沟通和记录其工作。成员已经拥有各种特设的在线会议,这些都将继续。该组还使用开放的科学框架来存储文档,并将使用Google文档等工具协作工作。任务组将寻求机会面对面。明显的场地是TDWG和SPNHC的年度会议,但成员也可能有机会在RDA会议和区域会议上举行会议。如果需要资金或其他资源,我们将寻求各种项目的支持,包括富国人,ALA和IDIGBIO。我们还将与开发人员联系到收集管理系统的开发人员,以使他们了解我们的工作。
最终,工作组将向TDWG的期刊BISS提交其建议,并遵循TDWG词汇维护标准使这些建议得到采纳。
概括
人们是生物多样性知识图中的重要因素。如果我们能够独特地识别人们,我们将能够在图中连接实体,例如标本,文学,序列和分类群名称。我们建议创建一个任务组,该组织将解决与人名称相关的标准的突出问题。该任务组还将推广人们与科学家和基础设施的使用情况使用,以确保在研究中普遍采用和使用。我们将在全球范围内进行这项工作,并从该领域的所有相关行动者寻求意见。对于这一任务组的目标,我们已经达到了相当大的工作,但我们觉得构成一个官方团体来获得合法性,促进更广泛的采用并与我们网络之外的利益攸关方联系。
资源
文学
新郎,Q.J, C. O 'Reilly和T. Humphrey, 2014。植物标本室标本揭示了1856-1932年英国和爱尔兰植物学家的交流网络。《植物学新杂志》4:95 - 103。https://doi.org/10.1179/2042349714Y.00000041.
Lindon, H. L., Gardiner, L. M., Brady, A., & Vorontsova, M. S.(2015)。少于3%的陆地植物物种由女性命名:作者性别超过260年。分类单元,64(2),209 - 215。
宾大,m.g., S. Cafferty和M. Carine. 2017。测绘植物学收藏者的历史:空间格局、多样性和时间独特性。生物多样性16:1-13。https://doi.org/10.1080/14772000.2017.1355854
Nicolson,N.,A. Paton,S. Phillips和A. Tucker。2018.标本作为研究对象:分布式存储库的对帐以实现元数据传播。2018年IEEE第14届电子科学国际会议(e-Scional)。https://doi.org/10.1109/eScience.2018.00028
Nicolson,N和A. Tucker。2017.识别来自标本数据的新功能,以预测有价值的收集旅行。计算机科学讲义235-246。https://doi.org/10.1007/978-3-319-68765-0_20
Thessen, a.e., Woodburn, M., Koureas, D., Paul, D., Conlon, M., Shorthouse, D.P. and Ramdeen, S., 2019。研究馆藏的管理和维护的正确归属:RDA/TDWG工作组的元数据建议。数据科学学报,18(1),p.54。http://doi.org/10.5334/dsj-2019-054
Vivo是成员支持的,开源软件以及代表奖学金的本体。↩
