有关数字标本(中间)的最低信息
收集文件的任务组(CD)兴趣小组的章程
召集人
- 亚历克斯·难以(英国卡迪夫大学)
- Elspeth Haston.(英国爱丁堡皇家植物园)
核心成员
- Wouter Addink,Naturalia,NL
- Mathias Dillen,Meise Botanic Garden,是
- Quentin新郎,Meise Botanic Garden,是
- FalkoGlöckler,博物馆FürnaturkundeBerlin,De
- Deborah Paul,Idigbio,美国
- Mareike Petersen,博物馆FürnaturkundeBerlin,De
- Hannu Saarenmaa,Bioshare数字化,FI
- 安东尼古茨奇,植物园和植物博物馆柏林,德
动机
在其最常规的意义上,自然科学中的数字化是将有关物理标本的模拟信息转换为数字形式的过程,包括电子文本,图像和其他表示。
然而,术语“数字化”被理解。它可以意味着例如:创建数据库记录(各种范围);制作集合容器,标本和/或标签的图像;数据捕获程度(转录,不包括或包括数据的解释);最近,最近,默认情况下的数据的语义富集,以及“出生数字”/'数字的概念'。从一个数字化倡议到另一个数字化,产出可能很大,因为目的,实践和程序因不同的收集类型和机构而异。因此,当策展人时,收集经理或科学家对数字化的东西谈论时,这是一种旨在的方式是明显的。也不明显是什么“足够的数字化”方式以及何时(如果根本)数字化完成。
此外,大多数集合需要报告对管理层和/或资助机构的数字化进度,因此需要商定的措施。
捕获作为TDWG标准的协调框架可以帮助澄清数字化的级别(深度)和在每个级别捕获和发布的最低信息。这有助于确保捕获足够的数据,策划和发布特定要求,因此它们对最广泛的可能目的是有用的;除此之外,更容易始终衡量随着时间的推移实现的数字化程度,并为剩余工作设置优先级。这样的框架也是有益的,因为\'出生的数字\'标本,数字数据被从一开始就是从收集事件开始的。
通过在其他生物学领域采用的“最低信息标准”的想法,我们将这一提议的TDWG标准称为“有关数字标本的最低信息”(MIDS) - 本任务组的主题。这种协调框架包括将数据公开可用因为世界各国中的笔访问策略要求数字数据应该可以找到和可访问,即使在可用数字化信息的最低级别也是如此。
目标,产出和结果
从现有的开始起草中间规格(7月2020年7月)通过贸易商和股东组织的意见开发,目的现在是扩大适用性,并实现导致广泛采用和实施的国际共识。
产出将包括标准草稿本身,使用案例的摘要,提出的试点实施和标准内容的评估,以及由其他TDWG标准的Mids Sup>的适当提案,如达尔文核心,ABCD,CD,
关于数字标本(中等)的最低信息的完整最低信息标准将被提交作为TDWG标准(2021年秋季)。
战略
TDWG 2020的工作会话将向TDWG社区介绍主题。
通过一系列每月虚拟工作会议,任务组将审查,讨论和改进现有规范草案,以适应不同收集类型和机构的数字化过程,程序和工作流程的可变性。
GitHub将用于协调工作和文件。在此开发任务驱动的工作计划,这将是公开可用的。该平台将支持重点的工作会议,并有助于从世界各地的生物和地理大学社区识别和聘请用户参与。
将记录和总结来自整个社区的使用案例。然后将根据评估过程的一部分测试中期标准,并根据评估过程的一部分进行测试,并根据需要进行调整。
在整个开发过程中还将在整个开发过程中进行中等标准的实施,以确定任何关键困难或障碍。
利益攸关方
来自生物和地理位置领域的一系列关键利益相关者可以被确定为中期的受益者。任务组将参与他们的参与,特别是为实施中期实施。利益攸关方包括:
用于自动化中段计算和缺失数据管理的集合管理系统的开发人员;众包平台与现场纳入与缺失数据管理的影响;还有其他软件工具;
数字化和管理人员,例如识别和管理缺失数据并计算进一步数字化的成本和计划;
管理和管理数字化战略和收到报告的管理;
公共关系工作人员公共交流数字化进度;和,
域专家/研究人员,例如用于评估和开发研究和教学的可用性,以及数据挖掘。
成为参与
此任务组欢迎任何对最低信息标准,数字标本信息,数字化流程和工作流程的经验以及数字化的后续管理(包括公开)的经验,包括报告管理和资助机构的报告要求。
联系召集人。
上下文/历史记录
最低信息标准一直是生物科学的倡议,以提供由相关科学方法所衍生的报告数据的准则。然而,作为一般原则,然而没有理由将它们限制为生物科学学科。无需捕获和呈现(发布)互操作性并被其他人重复使用的最低信息标准。遵循时,最低信息标准应确保这些数据可以轻松验证,分析和清楚地解释更广泛的科学界。最低信息标准还促进了结构化数据库,公共存储库和开发进程,程序和软件工具。
这科学收藏的最低信息标准(MISC)/权限档案工作组由Idigbio成立于2012年,国家资源推进国家科学基金会资助的生物多样性收藏数字化(ADBC)。它不是尝试为科学收藏的最低信息建立一个标准,而是试图建议数据提供者,应该为IDIGBIO基础设施提供哪些数据。指导(MISC 2012)表示所需的三类元素 - I)II)II)互补的互补性 - 这是支持更好的可发现性,研究使用和交联(通过全球使用例如,唯一的标识符(GUID)。这项工作帮助美国社区迈向了解加强发现,研究使用和联系所需的内容。
由欧盟地平线2020资助的设计学习工作icedig.项目(2018 - 2020)对于未来的欧洲分布式系统科学收藏系统(本科委托)研究基础设施确定,在讨论数字化时,许多人对这个词的了解不同。当某些东西被描述为已经数字化时,这导致混淆和不确定性。因此,“最低信息标准”的想法出生于包括一系列包括:
为收集所有者提供清晰度,他们应该发布退出数字化举措,以使数字标本信息可用于多种教学和学习,研究等。
协助全球努力通过提供结构化框架来估计为全世界30亿标本,阐明了数字化的结果和实现的数字化水平;协助剩余工作的优先顺序;
支持和促进适用于数据的适用性评估(适用性),用于喂养特定类型的数据处理管道;和,
协助研究人员了解他们在他们研究中使用的标本的文章和数据存款中包含的信息。
绘制现有工作,起草开始了解有关数字标本(中间)的最低信息的规范,(Hardisty等人。草稿),这是本发明康普尔科的准备项目。这项工作作为TDWG任务组的起点提供。
考虑到概述的目的的全球性质,现在是恰当的,提出了一个TDWG任务组,为主题准备全球标准草案。
与其他TDWG兴趣/任务组的关系
Audubon Core(AC IG):图像/媒体类型和特性超出了中间的范围。Mids限制了指示图像和其他媒体类型的可用性(或不)。因此,期望是AC可能在中期使用。
生物多样性数据质量:( BDQ IG):MIDS认识到质量测试和断言的重要性,但尚未研究含有精确的包容性/取向机制。中等人类可以包括预期的遵守陈述,例如在完整性方面。BDQ IG可能希望考虑实施高级数据质量检查的中期水平(至少用于质量参数\“完整性”)。采集描述(CD Ig):拟议的任务组应受到监督CD Ig作为主题,中期与自然科学材料的物理收集中对象的数字描述相关。该IG的召集人已被咨询并提供支持.Darwin Core(DW IG)和ABCD IG:Mids地图预计将出现在适当的达尔文核心和获取生物收集数据(ABCD)条款的信息元素。期望是,中期将进一步将该领域的收敛性进一步对准。地区科学和古生物学(ESP IG):中间TG的工作补充了ESP IG的产出,并定向,以确保有关生物和非的最低信息-biological (i.e., fossil, rock, mineral) specimens can be presented.
资源
努力,A.,Addink,W.,Dillen,M.,Growom,Q.,Haston,E.等人。(草案)有关数字标本(MIDS)V0.11,7月20日的最低信息。规范的案文。
罗宋汤,T.,Stevens,A.-D.,Häffner,E.,Güntsch,A.,Berendsohn,W.G.等。(2020):德国植物豆花的完全数字化是可能的,明智的,现在应该开始。研究理念和结果6:E50675。
MISC 2012.DIGBIO MISC数据元素目录(阶段1,V0,Rev。2012年12月15日)。
Alex Hardisty,Elspeth Haston
7月2020年
